
北大千问团队推出数学专用版CriticGPT,“找茬”让大模型进步更快
北大千问团队推出数学专用版CriticGPT,“找茬”让大模型进步更快批评不仅能让人进步,也能让大模型的能力提升。
批评不仅能让人进步,也能让大模型的能力提升。
只要10k数据,就能让大模型的数学成绩增长5.6%。
历经3个月,首届AI奥数竞赛终于公布最终结果了!Gemma 7B只能达到3/50正确率的题目中,第一名的Numina模型居然刷出了29/50的成绩。
在 AI 的帮助下,越来越多的数学问题得到了解决。
「忙碌海狸」难题困扰了计算机科学家40多年。如今,来自全球各地20+业余开发者和数学家们,终于取得了突破性进展。他们抓到了第五只忙碌海狸——用Coq辅助证明,得到答案47176870。对此陶哲轩激动地表示,这再次体现了证明助手对数学研究协作的重要性。
10亿名“员工”生产数据合成,数量占到了世界人口的13%。
就在刚刚,竞技场排名再次刷新:深度求索DeepSeek-Coder-v2成竞技场最强开源编码模型!
AI技术日新月异,近来Anthropic公司最新发布的Claude-3.5-Sonnet因在知识型推理、数学推理、编程任务及视觉推理等任务上设立新行业基准而引发广泛讨论
新鲜出炉的Claude 3.5 Sonnet,更快、更便宜,还是全球最强。
只要1/200的参数,就能让大模型拥有和GPT-4一样的数学能力? 来自复旦和上海AI实验室的研究团队,刚刚研发出了具有超强数学能力的模型。 它以Llama 3为基础,参数量只有8B,却在奥赛级别的题目上取得了比肩GPT-4的准确率。