2024 CSRankings全球计算机科学排名,刚刚发布!
全球CS排名中,中国高校/机构包揽了多个席位,其中CMU第一,清华第二,上交第3,北大第4。
就AI领域的世界TOP 10排名来看,中国表现非常亮眼,共有8所高校/机构进入全球前十(包含并列排名)。
2024年AI领域世界高校/机构排名中,最值得关注的一点是,中国科学学院跌出了世界前十(2023年排第8)。
CSRankings是由麻省州立大学阿姆赫斯特分校计算机与信息科学学院教授 Emery Berger 组织的全球院校计算机科学领域实力排名,完全基于研究指标,相对来说比较透明。
排名囊括了全球范围高校的计算机专业,以高校和研究机构在计算机科学领域顶级学术会议上发表的论文数量为参考依据。
按照地域划分,这项排名可以单独查到多个国家,还可以分为北美、南美、非洲、亚洲、澳洲、欧洲、全球。
CSRanking的细分排名分为4大类(27项小细分),分别为AI、系统、理论和跨学科领域。
在AI板块,主要有5个细分领域:1.人工智能(Artificial intelligence);2.计算机视觉(Computer vision);3.机器学习(Machine learning);4.自然语言处理(Natural language processing);5.网页信息检索(The Web & information retrieval)。
根据最新的CS Rankings,24年计算机科学专业全球整体排名Top 10如下——
卡耐基梅隆大学第1,清华大学第2,上海交通大学第3,北京大学和伊利诺伊大学厄巴纳-香槟分校并列第4,浙江大学第6,苏黎世联邦理工学院和佐治亚理工学院并列第7,韩国科学技术院、斯坦福大学、加州大学圣地亚哥分校、密歇根大学、华盛顿大学并列第9,MIT、新加坡国立大学、UC伯克利、 马里兰大学帕克分校并列第14。
选择「AI」选项可以看出,2024年的AI全球排名,国内多所高校进入TOP 20。
清华大学第1名,北京大学第2名,上海交大第3名,卡耐基梅隆大学和浙江大学并列第4名,韩国科学技术院第6名,中国人民大学第7名,南京大学第8名,新加坡国立大学第9名,复旦大学、哈尔滨工业大学并列第10名。
与2023年世界AI机构TOP 10排名相比,基本排名保持不变。
最值得一提的是,中国科学院在2024年排名中竟跌出了世界前十(去年位列世界第8)。另外,UIUC也被挤出了世界前十,新加坡国立大学、复旦大学成功晋升。
具体来看,清华大学在机器学习、NLP领域发表的论文,远远超过AI、计算机视觉、网页信息检索领域的论文数量。
其中,发表论文数超过10篇的教职工是,黄民烈(16)、孙茂松(15)、朱军(15)、李勇(11)、刘志远(11)、朱文武(11)、刘洋(10)。
北京大学在AI、计算机视觉、机器学习领域顶会论文发表数量均超过了40篇。
其中,超过10篇论文的教职工是赵东岩(12)、王奕森(11)、施柏鑫(10)。
上海交通大学在AI、机器学习论文数量最多。
顶会论文发表超过10篇的教职工有,严骏驰(29)、赵海(12)、王新兵(11)、杨小康(11)。
值得一提的是,CMU在机器学习领域的顶会论文数量超过了100篇。在AI板块之外,机器人领域的论文数量近50篇。
Graham Neubig(16)、J. Zico Kolter (14)、Deva Ramanan(11)论文数量超过了10篇。
并列第四的浙江大学,在AI、计算机视觉发表顶会论文数量均超过50篇。
顶会发表论文超过10篇论文的教职工是赵洲(20)、陈华钧(14)、杨易(14)。
在AI大类中选择「人工智能」方向,全球前十的高校是上海交通大学、浙江大学、南京大学、北京大学、中国人民大学、清华大学、哈尔滨工业大学、新加坡国立大学、武汉大学和韩国科学技术院。
在AI大类中选择「计算机视觉」方向,全球前十的高校是浙江大学、北京大学、韩国科学技术院、 卡耐基梅隆大学、穆罕默德·本·扎耶德人工智能大学、上海交通大学、苏黎世联邦理工学院、斯坦福大学、香港中文大学、南洋理工大学。
在AI大类中选择「机器学习」方向,全球前十的高校是卡耐基梅隆大学、斯坦福大学、韩国科学技术院、MIT、加州大学圣地亚哥分校、加州大学伯克利分校、加州大学洛杉矶分校、清华大学、北京大学、上海交通大学。
在AI大类中选择「自然语言处理」方向,全球前十的高校是哈尔滨工业大学、卡耐基梅隆大学、复旦大学、华盛顿大学、斯坦福大学、清华大学、北京大学、伊利诺伊大学厄巴纳-香槟分校、苏黎世联邦理工学院、加州大学洛杉矶分校。
在AI大类中选择「网页信息检索」方向,全球前十的高校分别是清华大学、中国人民大学、中国科学技术大学、浙江大学、阿姆斯特丹大学、复旦大学、伊利诺伊大学厄巴纳-香槟分校、北京大学、中国科学院大学、北京邮电大学。
在AI领域,中国机构排名前十的机构是:
清华第1名、北大第2名、上海交通大学第3名、浙江大学第4名、中国人民大学第5名、南京大学第6名、复旦大学第7名、哈尔滨工业大学第8名、中国科学院第9名、电子科技大学第10名。
和去年相比,前十名的机构整体不变。复旦大学有所提升(去年排第9),中国科学院排名大幅下降(去年排名第6)。
当前,1983年开始的《美国新闻与世界报道》(US News and World Report)排名最具声望。
不过,US News排名完全以声誉为基础,依赖于向各部门主管和研究生院主任进行调查。
就拿2023年US News世界排名一出离了大谱,把213所机构排名弄错了,留学圈也是吵翻了天。
包括之前哥大在US News的排名数据造假事件,也是掀起了腥风血雨。
另外,基于引用次数的指标也存在灌水的嫌疑。比如,有的大学就鼓励教职员工相互引用,「引用卡特尔」(Citation Cartels)也就看着光彩了。
不仅如此,并非所有论文引用都是免费的,而且变化很快,像Google Scholar中引文统计系统在作者歧义方面做的不是很好。
为了给所有人提供一个有意义且透明的排名体系,Emery Berger组织的全球院校计算机科学领域实力排名,完全基于「研究指标」进行排名。
具体来说,CSRankings是以绝大多数院校教员,在计算机科学领域的各大顶会发布的论文数量为衡量指标。
自然语言处理的顶会有ACL、EMNLP、NAACL;计算机视觉领域的顶会含CVPR、ECCV、ICCV;机器学习与数据挖掘会议的论文来自ICML、KDD 、NIPS;人工智能顶会则包含AAAI、IJCAI。
看得出,这种方法是为了激励教职员工在顶会上发表论文,而且CSrankings所有代码和数据共享,同时还能防止造假。
数据库的收录标准是,只要是特定校园中的全职、终身教职员工,并且能够单独为计算机科学专业的博士生提供指导,都可以被收录到数据库中。
因此,这种方法将数据库的覆盖范围扩大到了其他院系的一些教师,这些教师与计算机科学系或类似院系有兼职合同,可以为CS的博士生提供指导。
请注意,全职意味着在整个学年至少有75%的工作时间。
一名教职员工在一篇论文中可获得1/N分,其中N是作者人数,与他们的隶属关系或身份(教职员工、学生或其他身份)无关。这个数字永远不会变。
在所有作者都是/最终成为数据库中的教员的情况下,那么一篇论文最多只能算1.0分。
如果不按作者数量划分论文的学术产出量,仅简单计数论文数,那么作者可以很容易地通过增加作者来人为操纵和夸大单篇论文的产出量。
为了避免这种情况,必须分割论文的学术产出量。这可以激励作者适当地对待学术产出的署名,不滥用多作者夸大单篇论文的产出量。
参考资料:
https://csrankings.org/#/index?all&us
文章来自于微信公众号 “新智元”,作者 “Aeneas 、桃子”
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI