AI资讯新闻榜单内容搜索-大模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 大模型训练
性能大涨20%!中科大「状态序列频域预测」方法:表征学习样本效率max|NeurIPS 2023 Spotlight

性能大涨20%!中科大「状态序列频域预测」方法:表征学习样本效率max|NeurIPS 2023 Spotlight

性能大涨20%!中科大「状态序列频域预测」方法:表征学习样本效率max|NeurIPS 2023 Spotlight

SPF算法是一种基于状态序列频域预测的表征学习方法,利用状态序列的频域分布来显式提取状态序列数据中的趋势性和规律性信息,从而辅助表征高效地提取到长期未来信息。

来自主题: AI技术研报
8291 点击    2024-01-16 10:59
不要教一个AI学坏,因为它不会再学好

不要教一个AI学坏,因为它不会再学好

不要教一个AI学坏,因为它不会再学好

最近,AI初创公司Anthropic的研究表明,一旦LLM学会了人类教授的欺骗行为,它们就会在训练和评估的过程中隐藏自己,并在使用时偷偷输出恶意代码、注入漏洞。

来自主题: AI资讯
7198 点击    2024-01-16 10:06
拆掉英伟达护城河,细节曝光!世界最快超算用3072块AMD GPU训完超万亿参数LLM

拆掉英伟达护城河,细节曝光!世界最快超算用3072块AMD GPU训完超万亿参数LLM

拆掉英伟达护城河,细节曝光!世界最快超算用3072块AMD GPU训完超万亿参数LLM

世界上最快超算集群Frontier,用8%的GPU训练出了一个万亿级规模的大模型,而且是在AMD硬件平台之上完成。研究人员将训练的细节和克服的困难写成了一篇论文,展示了如何用非英伟达的生态完成大模型训练的技术框架和细节。

来自主题: AI资讯
5058 点击    2024-01-13 20:20
谷歌MIT最新研究证明:高质量数据获取不难,大模型就是归途

谷歌MIT最新研究证明:高质量数据获取不难,大模型就是归途

谷歌MIT最新研究证明:高质量数据获取不难,大模型就是归途

数据获取最新解,便是从生成模型中学习。获取高质量数据,已经成为当前大模型训练的一大瓶颈。

来自主题: AI资讯
4090 点击    2024-01-12 14:19
符尧:别卷大模型训练了,来卷数据吧!【干货十足】

符尧:别卷大模型训练了,来卷数据吧!【干货十足】

符尧:别卷大模型训练了,来卷数据吧!【干货十足】

今天分享一篇符尧大佬的一篇数据工程(Data Engineering)的文章,解释了speed of grokking指标是什么,分析了数据工程

来自主题: AI资讯
7800 点击    2024-01-02 11:13
ChatGPT变笨新解释:世界被AI改变,与训练时不同了

ChatGPT变笨新解释:世界被AI改变,与训练时不同了

ChatGPT变笨新解释:世界被AI改变,与训练时不同了

对于ChatGPT变笨原因,学术界又有了一种新解释。加州大学圣克鲁兹分校一项研究指出:在训练数据截止之前的任务上,大模型表现明显更好。

来自主题: AI技术研报
4000 点击    2024-01-01 23:12
国产千卡千亿模型训练平台落地:70B到130B大模型训练,线性加速比达91%

国产千卡千亿模型训练平台落地:70B到130B大模型训练,线性加速比达91%

国产千卡千亿模型训练平台落地:70B到130B大模型训练,线性加速比达91%

国内首个以国产全功能GPU为底座的大规模算力集群,正式落地了!这便是来自摩尔线程的KUAE智算中心,全国产千卡千亿模型训练平台。

来自主题: AI资讯
9600 点击    2023-12-21 11:03
OpenAI宫斗中被忽略的一部分:AI对齐

OpenAI宫斗中被忽略的一部分:AI对齐

OpenAI宫斗中被忽略的一部分:AI对齐

本文探讨了AI对齐在OpenAI公司中被忽视的一部分,以及AI对齐在大模型训练中的重要性和影响。文章揭示了OpenAI内部因AI对齐而产生的分歧,并阐述了AI对齐在保证AI按照人类意图和价值观运作方面的作用。同时,文章指出AI对齐在大模型训练中存在的性能阉割和对齐税等问题,以及AI对齐在大模型发展中的隐藏模型和重要性。

来自主题: AI资讯
5053 点击    2023-11-23 20:29