AI资讯新闻榜单内容搜索-LLama

8B模型奥数成绩比肩GPT-4！上海AI Lab出品

只要1/200的参数，就能让大模型拥有和GPT-4一样的数学能力？来自复旦和上海AI实验室的研究团队，刚刚研发出了具有超强数学能力的模型。它以Llama 3为基础，参数量只有8B，却在奥赛级别的题目上取得了比肩GPT-4的准确率。

来自主题: AI技术研报

10413 点击 2024-06-17 23:35

大模型+蒙特卡洛树搜索，一招让LLaMa-3 8B奥数水平直逼GPT-4

通过算法层面的创新，未来大语言模型做数学题的水平会不断地提高。

来自主题: AI技术研报

10528 点击 2024-06-17 19:32

英伟达开源3400亿巨兽，98%合成数据训出最强开源通用模型！性能对标GPT-4o

刚刚，英伟达全新发布的开源模型Nemotron-4 340B，有可能彻底改变训练LLM的方式！从此，或许各行各业都不再需要昂贵的真实世界数据集了。而且，Nemotron-4 340B直接超越了Mixtral 8x22B、Claude sonnet、Llama3 70B、Qwen 2，甚至可以和GPT-4掰手腕！

来自主题: AI技术研报

5384 点击 2024-06-15 15:58

又一届「AI春晚」拉开序幕！智源大模型集体爆发了

一年一度的国内「AI 春晚」—— 智源大会又一次拉开了序幕。

来自主题: AI技术研报

9822 点击 2024-06-15 15:45

英伟达开源最强通用模型Nemotron-4 340B

性能超越 Llama-3，主要用于合成数据。

来自主题: AI技术研报

11755 点击 2024-06-15 15:40

对话林咏华：刚在“AI春晚”上开源了3.4T数据集的智源，是如何死磕大模型数据难题的

本周五，一年一度的AI春晚“北京智源大会”正式开幕。本次大会AI明星浓度，放在全球范围内可能也是独一份：OpenAI Sora负责人Aditya Ramesh作为神秘嘉宾进行了分享，并接受了DiT作者谢赛宁的“拷问”、李开复与张亚勤炉边对话AGI、还集齐了国内大模型“四小龙”，百川智能CEO王小川、智谱AI CEO张鹏、月之暗面CEO杨植麟、面壁智能CEO李大海…… 这还只是第一天上午的开幕式。

来自主题: AI资讯

10197 点击 2024-06-15 15:38