谁在评价大模型?AI大模型评测榜单乱象调查
谁在评价大模型?AI大模型评测榜单乱象调查新华社研究院发布了《人工智能大模型体验报告2.0》,对国内主流大模型进行使用体验的横向测评。该榜单用500道题目评测了国内8款主流AI大模型,最终讯飞星火排名第一,百度文心一言排名第二,阿里通义千问排在倒数第二。
来自主题: AI资讯
11745 点击 2023-09-24 12:43
搜索
新华社研究院发布了《人工智能大模型体验报告2.0》,对国内主流大模型进行使用体验的横向测评。该榜单用500道题目评测了国内8款主流AI大模型,最终讯飞星火排名第一,百度文心一言排名第二,阿里通义千问排在倒数第二。
《华尔街日报》报道,Meta 公司一直在抢购人工智能训练芯片并建立数据中心,以创建一个与chatGPT 4.0一样强大的新AI。
一经发布,地表最强开源模型Falcon 180B直接霸榜HF。3.5万亿token训练,性能直接碾压Llama 2。
刚刚,陶哲轩大赞:用ChatGPT写Python代码,效果真是太好了,它直接为我节省了数学研究中半小时的工作量!
对于CEO来说,如果他们听到有竞争对手的产品可能把自己的产品击败,这将是一件让人非常上火的事情。最近Openai 的ceo Sam Altman就遇到了这样的情况。
OpenAI推出了语言模型的微调功能,该功能支持模型GPT-3.5 Turbo和GPT-4。