AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
完全使用「自生成数据」实现LLM自我纠正,DeepMind新突破SCoRe:纠正性能提升15.9%

完全使用「自生成数据」实现LLM自我纠正,DeepMind新突破SCoRe:纠正性能提升15.9%

完全使用「自生成数据」实现LLM自我纠正,DeepMind新突破SCoRe:纠正性能提升15.9%

Google DeepMind的SCoRe方法通过在线多轮强化学习,显著提升了大型语言模型在没有外部输入的情况下的自我修正能力。该方法在MATH和HumanEval基准测试中,分别将自我修正性能提高了15.6%和9.1%。

来自主题: AI技术研报
10111 点击    2024-09-27 19:26
颠覆认知:大模型不可靠,越大越不可靠?最新研究登上 Nature

颠覆认知:大模型不可靠,越大越不可靠?最新研究登上 Nature

颠覆认知:大模型不可靠,越大越不可靠?最新研究登上 Nature

“通用人工智能(AGI)的设计和开发,需要进行根本性改变。” 人工智能(AI)模型的参数规模越大,生成的答案就越准确?就更加可信? 还真不一定!

来自主题: AI资讯
3290 点击    2024-09-27 10:31
一行代码训练成本再降30%,AI大模型混合精度训练再升级|开源

一行代码训练成本再降30%,AI大模型混合精度训练再升级|开源

一行代码训练成本再降30%,AI大模型混合精度训练再升级|开源

FP8通过其独特的数值表示方式,能够在保持一定精度的同时,在大模型训练中提高训练速度、节省内存占用,最终降低训练成本。

来自主题: AI技术研报
3156 点击    2024-09-26 11:57
调研219篇文献,全面了解GenAI在自适应系统中的现状与研究路线图

调研219篇文献,全面了解GenAI在自适应系统中的现状与研究路线图

调研219篇文献,全面了解GenAI在自适应系统中的现状与研究路线图

自适应系统在动态和不确定的环境中具有关键作用,广泛应用于自动驾驶、智能制造、网络安全和智能医疗等领域。

来自主题: AI技术研报
3353 点击    2024-09-26 11:13
斯坦福新作:无指令调优的指令遵循

斯坦福新作:无指令调优的指令遵循

斯坦福新作:无指令调优的指令遵循

指令调优(Instruction tuning)是一种优化技术,通过对模型的输入进行微调,以使其更好地适应特定任务。先前的研究表明,指令调优样本效率是很高效的,只需要大约 1000 个指令-响应对或精心制作的提示和少量指令-响应示例即可。

来自主题: AI技术研报
3296 点击    2024-09-26 11:06
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速

自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速

自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速

科学技术的快速发展过程中,机器学习研究作为创新的核心驱动力,面临着实验过程复杂、耗时且易出错,研究进展缓慢以及对专门知识需求高的挑战。近年来,LLM 在生成文本和代码方面展现出了强大的能力,为科学研究带来了前所未有的可能性。然而,如何系统化地利用这些模型来加速机器学习研究仍然是一个有待解决的问题。

来自主题: AI技术研报
7750 点击    2024-09-25 20:20
当大模型Scaling Law继续,万卡集群算力释放在「百舸」这里找到一条通途

当大模型Scaling Law继续,万卡集群算力释放在「百舸」这里找到一条通途

当大模型Scaling Law继续,万卡集群算力释放在「百舸」这里找到一条通途

在电影《天下无贼》中,葛优扮演的黎叔有这样一句经典的台词,「二十一世纪什么最贵?人才!」而随着人工智能行业进入到大模型时代,这一问题的答案已然变成了「算力」。

来自主题: AI资讯
7714 点击    2024-09-25 20:12
突破数据墙!27岁华裔MIT辍学创业8年,年化收入逼近10亿

突破数据墙!27岁华裔MIT辍学创业8年,年化收入逼近10亿

突破数据墙!27岁华裔MIT辍学创业8年,年化收入逼近10亿

就在刚刚,创业成功的27岁亿万富翁Alexandr Wang宣布—— Scale AI的年化收入,几乎达到了10亿美元! 这个数字,足够震惊整个硅谷的。

来自主题: AI资讯
3642 点击    2024-09-25 17:13