AI资讯新闻榜单内容搜索-2

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 2
AI数学神话破灭!FrontierMath让LLM集体几乎“交白卷”:正确率不超过2%

AI数学神话破灭!FrontierMath让LLM集体几乎“交白卷”:正确率不超过2%

AI数学神话破灭!FrontierMath让LLM集体几乎“交白卷”:正确率不超过2%

大型语言模型(LLM)最近在各种数学benchmark上疯狂刷分,动辄90%以上的正确率,搞得好像要统治数学界一样。然而,Epoch AI看不下去了,联手60多位顶尖数学家,憋了个大招——FrontierMath,一个专治LLM各种不服的全新数学推理测试!结果惨不忍睹,LLM集体“翻车”,正确率竟然不到2%!

来自主题: AI技术研报
5959 点击    2024-11-11 14:36
小道消息:AI期货sora将在2周后正式发布

小道消息:AI期货sora将在2周后正式发布

小道消息:AI期货sora将在2周后正式发布

openai最近又放出了Sora最新的宣传片,有内部人士小道消息称sora将在2周后正式发布。

来自主题: AI资讯
8733 点击    2024-11-11 07:33
12 个 RAG 痛点和建议的解决方案-解决检索增强生成的核心挑战

12 个 RAG 痛点和建议的解决方案-解决检索增强生成的核心挑战

12 个 RAG 痛点和建议的解决方案-解决检索增强生成的核心挑战

受到 Barnett 等人的论文《设计检索增强生成系统时的七个故障点》的启发,让我们在本文中探讨该论文中提到的七个故障点以及开发 RAG 管道时的另外五个常见痛点。

来自主题: AI技术研报
12562 点击    2024-11-10 22:05
教授何恺明在MIT的第二门课——《深度生成模型》,讲座PPT陆续已出

教授何恺明在MIT的第二门课——《深度生成模型》,讲座PPT陆续已出

教授何恺明在MIT的第二门课——《深度生成模型》,讲座PPT陆续已出

又有机会跟着大神学习了! 今年 2 月起,何恺明已经开始了自己在 MIT 的副教授职业生涯,并在 3 月 7 日走上讲台完成了「人生中教的第一堂课」。

来自主题: AI资讯
6066 点击    2024-11-10 14:21
NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界?

NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界?

NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界?

该文章的第一作者陈麒光,目前就读于哈工大赛尔实验室。他的主要研究方向包括大模型思维链、跨语言大模型等。 该研究主要提出了推理边界框架(Reasoning Boundary Framework, RBF),首次尝试量化并优化思维链推理能力。

来自主题: AI技术研报
5277 点击    2024-11-10 13:50
泄密!谷歌Gemini 2.0遭意外曝光!

泄密!谷歌Gemini 2.0遭意外曝光!

泄密!谷歌Gemini 2.0遭意外曝光!

11月8日,社交媒体上有博主爆料,谷歌正准备推出一款新型号:Gemini 2.0。

来自主题: AI资讯
4324 点击    2024-11-09 17:49
重磅盘点丨那些 AI 公司悄咪咪上线的产品(十四)

重磅盘点丨那些 AI 公司悄咪咪上线的产品(十四)

重磅盘点丨那些 AI 公司悄咪咪上线的产品(十四)

自外滩大会蚂蚁集团发布支小宝、蚂小财、百宝箱等 AI 产品之后,我们又关注到他们于 10 月 29 日,上线了一款浏览器插件,百宝箱 AI 助手。

来自主题: AI资讯
5400 点击    2024-11-09 16:00
全球首个法律o1大模型发布,System2范式下慢思考法律专家|港科大&北大

全球首个法律o1大模型发布,System2范式下慢思考法律专家|港科大&北大

全球首个法律o1大模型发布,System2范式下慢思考法律专家|港科大&北大

OpenAI o1风格的推理大模型,有行业垂直版了。HK-O1aw,是由香港生成式人工智能研发中心(HKGAI)旗下AI for Reasoning团队(HKAIR) 联合北京大学对齐团队(PKU-Alignment Team)推出的全球首个慢思考范式法律推理大模型。

来自主题: AI资讯
4960 点击    2024-11-09 15:34