
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe
87.8%准确率赶超GPT-4o登顶!谷歌DeepMind发布自动评估模型FLAMe谷歌DeepMind推出LLM自动评估模型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表现卓越,以87.8%准确率领先GPT-4o。
谷歌DeepMind推出LLM自动评估模型FLAMe系列,FLAMe-RM-24B模型在RewardBench上表现卓越,以87.8%准确率领先GPT-4o。
这么强的模型,谷歌给大家免费试用。
起猛了,GPT-4o被谷歌新模型超越了!
今年 6 月底,谷歌开源了 9B、27B 版 Gemma 2 模型系列,并且自亮相以来,27B 版本迅速成为了大模型竞技场 LMSYS Chatbot Arena 中排名最高的开放模型之一,在真实对话任务中比其两倍规模以上的模型表现还要好。
谷歌DeepMind的小模型核弹来了,Gemma 2 2B直接击败了参数大几个数量级的GPT-3.5和Mixtral 8x7B!而同时发布的Gemma Scope,如显微镜一般打破LLM黑箱,让我们看清Gemma 2是如何决策的。
这两天,Apple Intelligence 的上线成为了最大的科技新闻之一。
AI仅拉动微软Azure云增长8%,谷歌云季收入首超百亿美元。
OnLeaks 与 Android Headlines 分享了一个展示 Pixel 9 「添加我」拍照新功能的视频。
公开文件显示,苹果开发自家的人工智能(AI)系统Apple Intelligence离不开谷歌定制芯片的支持。
19秒破解几何难题,谷歌AI夺得IMO银牌在业界掀起了巨震。就连菲尔兹奖得主陶哲轩,前IMO美国队负责人罗博深都对此大加赞赏。更有AI大佬高调预测,若谷歌继续加码研究,应该可以造出一个「AI陶哲轩」。