ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
AI | MO数学竞赛启动,陶哲轩力荐!50题对3道,百万大奖抱回家
5261点击    2024-04-03 16:24

【新智元导读】又一项针对AI模型的数学奥赛来了!只要在50道题中做出3道,就有可能把百万美元大奖抱回家。题目难度为人类的高中学术竞赛难度,包括基础算术、代数思维和几何推理。欢迎AI模型们踊跃报名。


AI大模型的数学竞赛,正在如火如荼地进行中。


就在刚刚,又一项针对AI参赛者的赛事官宣了。


挑战内容是,在6月27日之前提交一个AI模型,在一组50个测试题中表现良好。


何谓表现良好呢?此前官方测试的基准模型Gemma 7B,只能正确回答50个问题中的3个,而获奖者必须至少达到这个基准。


而获胜AI,可以直接把104.8万美元的大奖抱回家!



陶哲轩已经转发了消息,欢迎广大AI志士参赛。



本次比赛的目标是,创建能够解决以LaTeX格式编写的棘手数学难题的算法和模型。


而广大的参赛者,能够提高AI模型的数学推理技能,推动前沿知识的发展。



从大赛主页上可以看出,才不到两天时间里,已经有1515名参赛者,完成了112个提交。



比赛介绍


无论是构建工程学的奇迹还是设计复杂的金融模型,数学推理都扮演着基石的角色。


但目前,AI在这方面的能力还相对有限。


为了激发开发能够匹敌国际数学奥林匹克(IMO)顶尖参赛者表现的AI模型,kaggle设立了一个奖金高达1000万美元的AI数学奥林匹克(AIMO)。


不过,评估AI模型在数学推理方面的能力时,有一个主要挑战:训练-测试泄露问题。也就是,模型可能会在训练过程中不小心接触到测试题目。


为解决这一问题,比赛采用了一个由国际专家团队精心设计的数据集。这110道全新的数学题,覆盖了从基础算术到代数思维、几何推理等不同难度,大致相当于中级水平的高中数学竞赛。


在这些问题上,Gemma 7B的评分标准在公开和私人测试集上仅为3/50。


时间表


2024年4月1日:比赛开始。


2024年6月20日:报名截止。


2024年6月20日:团队合并最后期限。


2024年6月27日:最终提交截止。


奖项设置


进步奖(Progress Prize):$1,048,576


排名前列的团队将获得以下奖金:

第一名:$131,072

第二名:$65,536

第三名:$32,768

第四名:$16,384

第五名:$8,192


如果前五名中的任一团队在公开和私有测试集上的得分都未能超过Gemma 7B的3/50基准,奖金将减少到原来的四分之一,具体数额如下:


第一名:$32,768

第二名:$16,384

第三名:$8,192

第四名:$4,096

第五名:$2,048


综合进步奖(Overall Progress Prize):将授予在公开及私有测试集上至少获得47/50分的最高排名团队。在为排名前五的团队颁发奖金后,总奖金的剩余部分将颁发给综合进步奖获得者。


如果本次比赛产生了获胜者,其奖金不低于$794,624。如果没有团队获得该奖,剩余的奖金将转入下一届比赛,采用相同的奖金分配方式。


评估方法


提交内容将根据其预测标签和真实标签之间的准确性进行评估。


换言之,提交会按与真实标签完全匹配的预测标签的比例,来进行排名。


在本次竞赛中,每个真值标签都是介于0和999之间的整数(含0和999)。


代码要求


本次比赛的参赛作品需要通过Notebooks进行,并且必须满足以下条件:


- CPU Notebook <= 9 小时运行时间

- GPU Notebook <= 9 小时运行时间

- 禁止互联网访问

- 允许免费和公开的外部数据,包括预训练模型

- 提交文件必须命名为submission.csv


参考资料:

https://www.kaggle.com/competitions/ai-mathematical-olympiad-prize/overview


文章来自微信公众号“新智元”,作者:新智元