ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
Hugging Face最受欢迎15大AI机构出炉!清华第五,OpenAI第十,冠军竟是它?
4646点击    2023-11-24 15:29


Hugging Face上最受欢迎的15个AI公司出炉了!


目前的冠军,是Stability AI。


开源英雄Meta AI,取得亚军之位。


而我们熟知的微软、谷歌、OpenAI,分别名列第八、九、十的位置。



15个最受AI开源社区欢迎的公司


截止23年11月24日,榜单如下——


1. Stability AI,20000个赞



2022年AI大爆炸的两个标志性事件,一个是ChatGPT,一个就是Stable Diffusion。


作为开源的图像生成模型,可以说,Stable Diffusion的发布将AI生图提高到了全新的高度,影响不亚于Open AI发布ChatGPT。


Stability AI,就是大名鼎鼎的Stable Diffusion背后的公司之一,掌门人和联合创始人是Emad Mostaque。


不过,他此前有一些不好的传言。



另外,Stability AI也开源了自己的大语言模型——StableLM。


2. Meta AI,20000个赞



实至名归,Llama模型的开源鼻祖,如今大模型领域开源和闭源模型能够分庭抗礼,没有全被OpenAI、谷歌等明星初创公司和大科技公司垄断,Meta AI功不可没。


也因此,小扎被公认为「开源英雄」,而图灵三巨头之一的Yann LeCun,在Meta也起着定海神针的作用。



虽然排名第二,但是赞数和第一完全没有差距。可以说Meta AI就是最受开源社区欢迎的AI公司。


正所谓,「开源AI社区共一石,Meta独占八斗」。如果没有Meta和LeCun对于AI开源社区的贡献,整个AI行业的格局都会完全改变。


整个AI行业和开源AI的未来的发展,某种程度上都要倚仗LeCun和小扎继续真金白银的投入,以及不断地摇旗呐喊。


3. Runway,11000个赞


视频生成工具Gen-2,已经成为生成式AI视频领域的标杆,每次一发布更新,都能引起业内不小的震撼。



从三无青年到15亿美元独角兽CEO,Runway CEO的故事,不过是又一个「平平无奇」的硅谷神话。


2018年,Cris Valenzuela(CEO)、Anastasis Germanidis和Alejandro Matamala-Ortiz 在纽约创办Runway, 今年5月,Runway已完成了1.41亿美元的C轮融资,估值达到15 亿美元。



4. CompVis,10000个赞


Stable Diffusion,是Stability AI、RunwayML、LMU Munich、EleutherAI 和LAION的研究人员合作的结果。


在CompVis领导下的Stable Diffusion V1,改变了开源AI模型的性质,在全球范围内催生出了数百个其他模型和创新。


Runway的Patrick Esser和LMU 慕尼黑的Robin Rombach领导了这个项目,他们在海德堡大学CompVis小组的研究奠定了这个项目的基础。


在海德堡大学,他们创建了广泛使用的VQGAN和Latent Diffusion。这两个模型再加上OpenAI和Google Brain的成果,使Stable Diffusion得以实现。


5. 清华KEG,7,000个赞


清华KEG实验室,一直是国内AI技术的领头羊。


中国顶尖开源大模型ChatGLM2-6B,可以说是清华系的ChatGPT,由清华知识工程研究室和智谱AI训练。



ChatGLM2-6B允许免费商用后,我国的开源大模型也开启了「安卓时刻」。


而清华系17人,则直接撑起了中国大模型创业的半壁江山。



6. BigScience,7,000个赞


BigScience Research Workshop,不是正式成立的实体,而是由HuggingFace、GENCI和IDRIS发起的开放式协作组织,以及一个同名的LLM研讨会,汇聚了全球1000+研究人员。


这1000多名志愿研究者,在BigScience项目中创建了拥有1760亿参数的模型BLOOM。



BLOOM是BigScience Large Open-science Open-access Mul-tilingual Language Model首字母的缩写,全名代表着大科学、大型、开放科学、开源的多语言大模型。


7. 阿联酋技术创新研究所,7000个赞


阿联酋技术创新研究所隶属于阿布扎比政府先进技术研究委员会 (ATRC) ,负责监督酋长国的技术研究。



2023年9月6日,阿联酋(UAE)技术创新研究所(TII)推出Falcon180B,再次突破生成式AI的界限。


Falcon 180B拥有惊人的1800亿参数,经过3.5万亿个token的训练,在预训练LLM的HuggingFace排行榜上名列前茅。甚至,它在各种基准测试中,都胜过了Meta的LaMA 2这种级别的竞争对手,包括推理、编码、熟练程度和知识测试。



而且作为第一个有影响力的不限制商用的开源模型,Falcon用中东金主爸爸的豪气,把开源模型的限制彻底打下来了。


这就不奇怪为什么开源社区对他们好感爆棚。


8. 微软,6500个赞


在ChatGPT大爆发之后,突然化身「创业公司」的微软,成为了硅谷大厂中今年最亮的一颗星。


微软快速跟进,利用大模型能力改造了Bing,加班加点推出Copilot,并把他们塞进了自家的拳头产品Office和Windows之中,给科技圈秀了一把这家「年近50」科技巨头的「狼性」。



另一边,微软Azure作为云计算行业的头部玩家,无缝驶入了AI算力需求的快车道。


他们和Meta合作,对Llama 2等开源模型提供的良好支持,也进一步刷了一波在开源社区的好感度和存在感。


在最近的OpenAI惊天宫斗系列剧中,微软差点通过「OpenAI 0元购」,成为了AI赛道的「终极寡头」。



9. Google AI,6000个赞


作为对于AI技术投入最早也最大的科技巨头,谷歌在AI社区中的影响力不用怀疑。



从AI基础研究到AI产品,谷歌早已浑身上下都流淌着AI的血液。


DeepMind在强人工智能领域不断地取得令人瞩目的突破,谷歌云作为AI算力提供商是AI行业的基础设计建设中最重要的一环。


虽然谷歌Bard和Palm大模型暂时在竞争之中不占优势,但传说中的Gemini似乎迟早要将谷歌拉回AI行业舞台的最中心。



而对于开源社区的发展,谷歌的贡献同样功不可没,无数的开源项目已经成为AI开源社区的基石。



10. OpenAI,4000个赞


作为AI行业今年大爆发的直接引领者,OpenAI的地位是毋庸置疑的。



虽然被调侃为「ClosedAI」,但是OpenAI对于AI开源社区的贡献也是有目共睹的。


Whisper作为开源且性能最好的语音识别模型,几乎所有相关的从业人员都能从中受益。



希望刚刚结束了「权游」的OpenAI,能继续瞄准AGI,为整个AI行业开拓上限。


11. BigCode Project,4,000个赞


BigCode是一个开放的科学合作组织,致力于为编码应用程序进行负责任的LLM训练。


他们的主要工作有——


StarCoder,一种最先进的代码语言模型。



BigCode项目中的StarCoder,是一个160亿参数的模型,它使用了80多种编程语言、GitHub问题、Git提交和Jupiter 笔记本的一万亿个token。


StarCoder可以通过聊天进行微调,创建一个性化的编码助手StarChat。


另外还有OctoPack,用于指令调优大型代码模型的工件;The Stack,最大的可用预训练数据集,具有外围代码;SantaCoder,一个1.1B参数的代码模型。


12. MosaicML,4000个赞


在今年6月被DataBrick斥资13亿刀收购的独角兽MosaicML,非常引人瞩目。


从此,MosaicML的生成式AI平台和Databricks的数据管理能力结合,将形成双赢。



这家公司创立于21年,仅有62人。


创始人Naveen Rao是创办的第一家公司Nervana Syatems,被英特尔收购。另一位创始人Hanlin Tan,是一位连续创业者,曾创立云计算公司,以及在谷歌、微软和英特尔担任职位。


MosaicML提供了一些开源、可商用的LLM,比如MPT模型。


MPT-7B和MPT-30B两个模型,是目前最先进的开源、可商用的LLM之一。



13. UKP Lab,3000个赞


UKP Lab(无处不在的知识处理实验室)由Iryna Gurevych教授于2009年创立,是达姆施塔特工业大学计算机科学系的一部分。



UKP Lab在自然语言处理(NLP)方面开展前沿研究,重点关注大型语言模型、对话式人工智能、问答、跨文档NLP以及新颖的数据集和问题定义。



14. EleutherAI,3000个赞


EleutherAI成立于2020年7月,由Connor Leahy、Sid Black和Leo Gao创立,从一个讨论GPT-3的Discord服务器,发展成为一个专注于大规模人工智能研究的非营利性研究机构。



现在,它是是一个开源的社区人工智能项目,旨在创建一个完全去中心化的、具有自治文明的单例人工智能。任何能连接互联网且有GitHub帐户的人都可以参与。


2021年,EleutherAI发布了The Pile,是一个825GB的多样化文本数据集。


2021年6月,EleutherAI公布了GPT-J,它是一个60亿参数的模型,在Pile上训练。发布时,它是世界上最大的公开GPT-3风格的语言模型。


随着GPT-NeoX的出现,EleutherAI计划将参数一直提高到1750亿,发起了争夺最大GPT-3模型的挑战赛。


2023年4月,它发布了Pythia系列大模型。


15. Salesforce,3000个赞


Salesforce,是创建于1999年3月的一家客户关系管理(CRM) 软件服务提供商,总部设于美国旧金山,可提供随需应用的客户关系管理平台。


创始人是Marc Benioff。27岁时,他就成为Oracle历史上最年轻的高级副总裁。



正是因为预见到,会有越来越多的企业通过互联网得到软件服务,他才选择离开Oracle,在37岁时创立Slesforce。


他提出了云计算和SaaS的理念,被誉为「软件终结者」。


当下Salesforce正在推出AI功能,试图将人工智能整合到办公空间即时通讯应用Slack等产品中,并为销售人员等推出了一款名为Einstein GPT的生成式人工智能产品。



Benioff称,「我们非常渴望确保Salesforce成为第一大人工智能CRM。」



参考资料:

https://twitter.com/osanseviero/status/1727260746289905920



文章来自微信公众号 “ 新智元 ”,作者 新智元









AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

2
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner