
对话涂津豪:17 岁,拿下阿里数赛 AI 赛道全球第一
对话涂津豪:17 岁,拿下阿里数赛 AI 赛道全球第一阿里巴巴全球数学竞赛,已经举办了六年。 在今年三月,组委会宣布了一件振奋人心的事情—— “不论碳基和硅基”,今年首次开辟了 AI 赛道。
来自主题: AI资讯
11076 点击 2024-09-30 12:05
阿里巴巴全球数学竞赛,已经举办了六年。 在今年三月,组委会宣布了一件振奋人心的事情—— “不论碳基和硅基”,今年首次开辟了 AI 赛道。
OpenAI的o1系列一发布,传统数学评测基准都显得不够用了。
13.8和13.11哪个大?这个问题不光难倒了部分人类,还让一票大模型折戟。AI如今都能做AI奥数题了,但简单的常识问题对它们依然难如登天。其实,无论是比大小,还是卷心菜难题,都揭示了LLM在token预测上的一个重大缺陷。
历经3个月,首届AI奥数竞赛终于公布最终结果了!Gemma 7B只能达到3/50正确率的题目中,第一名的Numina模型居然刷出了29/50的成绩。
只要1/200的参数,就能让大模型拥有和GPT-4一样的数学能力? 来自复旦和上海AI实验室的研究团队,刚刚研发出了具有超强数学能力的模型。 它以Llama 3为基础,参数量只有8B,却在奥赛级别的题目上取得了比肩GPT-4的准确率。