AI资讯新闻榜单内容搜索-Math

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Math

AI数学神话破灭！FrontierMath让LLM集体几乎“交白卷”：正确率不超过2%

AI数学神话破灭！FrontierMath让LLM集体几乎“交白卷”：正确率不超过2%

AI数学神话破灭！FrontierMath让LLM集体几乎“交白卷”：正确率不超过2%

大型语言模型（LLM）最近在各种数学benchmark上疯狂刷分，动辄90%以上的正确率，搞得好像要统治数学界一样。然而，Epoch AI看不下去了，联手60多位顶尖数学家，憋了个大招——FrontierMath，一个专治LLM各种不服的全新数学推理测试！结果惨不忍睹，LLM集体“翻车”，正确率竟然不到2%！

来自主题: AI技术研报

6429 点击 2024-11-11 14:36

完全使用「自生成数据」实现LLM自我纠正，DeepMind新突破SCoRe：纠正性能提升15.9%

完全使用「自生成数据」实现LLM自我纠正，DeepMind新突破SCoRe：纠正性能提升15.9%

完全使用「自生成数据」实现LLM自我纠正，DeepMind新突破SCoRe：纠正性能提升15.9%

Google DeepMind的SCoRe方法通过在线多轮强化学习，显著提升了大型语言模型在没有外部输入的情况下的自我修正能力。该方法在MATH和HumanEval基准测试中，分别将自我修正性能提高了15.6%和9.1%。

来自主题: AI技术研报

11978 点击 2024-09-27 19:26

北大AI奥数评测，o1-mini比o1-preview分数还高

北大AI奥数评测，o1-mini比o1-preview分数还高

北大AI奥数评测，o1-mini比o1-preview分数还高

OpenAI的o1系列一发布，传统数学评测基准都显得不够用了。

来自主题: AI技术研报

10189 点击 2024-09-23 15:30

人均融资1亿美元，一个有故事可讲的AI赛道

人均融资1亿美元，一个有故事可讲的AI赛道

人均融资1亿美元，一个有故事可讲的AI赛道

AI 与数学普惠。这一期将作为“AI+教育”系列的中篇来聊一聊 AI 在数学领域的应用。

来自主题: AI资讯

4959 点击 2024-09-19 09:08

刚刚，开源大模型的新王诞生了：超越GPT-4o，模型还能自动纠错

刚刚，开源大模型的新王诞生了：超越GPT-4o，模型还能自动纠错

刚刚，开源大模型的新王诞生了：超越GPT-4o，模型还能自动纠错

快速更迭的开源大模型领域，又出现了新王：Reflection 70B。横扫 MMLU、MATH、IFEval、GSM8K，在每项基准测试上都超过了 GPT-4o，还击败了 405B 的 Llama 3.1。这个新模型 Reflection 70B，来自 AI 写作初创公司 HyperWrite。

来自主题: AI资讯

9003 点击 2024-09-06 16:36

哪里不会扫哪里！全球最强数学大模型发布人人可玩Demo，阿里多模态模型加持，中文适用

哪里不会扫哪里！全球最强数学大模型发布人人可玩Demo，阿里多模态模型加持，中文适用

哪里不会扫哪里！全球最强数学大模型发布人人可玩Demo，阿里多模态模型加持，中文适用

现在，最强数学大模型，人人都可上手玩了！

来自主题: AI资讯

8473 点击 2024-08-20 15:02

Mistral最新开源数学模型 Mathstral，能不能算对 9.11 和 9.9谁大？｜AI 鲜测

Mistral最新开源数学模型 Mathstral，能不能算对 9.11 和 9.9谁大？｜AI 鲜测

Mistral最新开源数学模型 Mathstral，能不能算对 9.11 和 9.9谁大？｜AI 鲜测

这几日，AI 圈又一“震惊”事件！！

来自主题: AI资讯

11926 点击 2024-07-19 12:40

Mistral AI两连发：7B数学推理专用、Mamba2架构代码大模型

Mistral AI两连发：7B数学推理专用、Mamba2架构代码大模型

Mistral AI两连发：7B数学推理专用、Mamba2架构代码大模型

网友很好奇，Mathstral能不能搞定「9.11和9.9谁大」这一问题。

来自主题: AI资讯

11750 点击 2024-07-17 20:28

原作亲自下场！Mistral首款开源7B Mamba模型「埃及艳后」效果惊艳

原作亲自下场！Mistral首款开源7B Mamba模型「埃及艳后」效果惊艳

原作亲自下场！Mistral首款开源7B Mamba模型「埃及艳后」效果惊艳

最近，7B小模型又成为了AI巨头们竞相追赶的潮流。继谷歌的Gemma2 7B后，Mistral今天又发布了两个7B模型，分别是针对STEM学科的Mathstral，以及使用Mamaba架构的代码模型Codestral Mamba。

来自主题: AI技术研报

11076 点击 2024-07-17 19:53

AlphaGo核心算法增强，7B模型数学能力直逼GPT-4，阿里大模型新研究火了

AlphaGo核心算法增强，7B模型数学能力直逼GPT-4，阿里大模型新研究火了

AlphaGo核心算法增强，7B模型数学能力直逼GPT-4，阿里大模型新研究火了

把AlphaGo的核心算法用在大模型上，“高考”成绩直接提升了20多分。

来自主题: AI技术研报

10251 点击 2024-05-09 15:48

上一页当前第6页,共7页下一页