AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
MoE与Mamba强强联合,将状态空间模型扩展到数百亿参数

MoE与Mamba强强联合,将状态空间模型扩展到数百亿参数

MoE与Mamba强强联合,将状态空间模型扩展到数百亿参数

状态空间模型(SSM)是近来一种备受关注的 Transformer 替代技术,其优势是能在长上下文任务上实现线性时间的推理、并行化训练和强大的性能。而基于选择性 SSM 和硬件感知型设计的 Mamba 更是表现出色,成为了基于注意力的 Transformer 架构的一大有力替代架构。

来自主题: AI技术研报
11426 点击    2024-01-23 15:09
GPT-5被5万张H100卡脖子!Altman急筹数十亿美元,欲取代英伟达建起AI芯片帝国

GPT-5被5万张H100卡脖子!Altman急筹数十亿美元,欲取代英伟达建起AI芯片帝国

GPT-5被5万张H100卡脖子!Altman急筹数十亿美元,欲取代英伟达建起AI芯片帝国

最近,外媒曝出Sam Altman正计划筹集数十亿美元,为OpenAI建起全球性的半导体晶圆厂网络。GPT-5训练严重缺芯,OpenAI誓不让英伟达掌握主动权,干脆自己做新的AI芯片霸主?

来自主题: AI资讯
3923 点击    2024-01-22 15:19
“AI学会欺骗,人类完蛋了”?看完Anthropic的论文,我发现根本不是这回事啊

“AI学会欺骗,人类完蛋了”?看完Anthropic的论文,我发现根本不是这回事啊

“AI学会欺骗,人类完蛋了”?看完Anthropic的论文,我发现根本不是这回事啊

AGI若到来,人类是否会受到威胁,是一个大众热衷讨论同时研究者们也很关注的问题,从各个角度对此的研究几乎都会引发人们的讨论。最新的一个重磅研究来自今天最重要的大模型公司之一Anthropic。

来自主题: AI资讯
8394 点击    2024-01-22 11:05
五位清华教授团建!从复杂推理到算力瓶颈,他们眼中“通用人工智能” 该如何降临?

五位清华教授团建!从复杂推理到算力瓶颈,他们眼中“通用人工智能” 该如何降临?

五位清华教授团建!从复杂推理到算力瓶颈,他们眼中“通用人工智能” 该如何降临?

要真正的实现AGI的话,需要有强大的模型和数量庞大且高质量的数据、可扩展的基础训练以及符号化的方法。

来自主题: AI资讯
10672 点击    2024-01-21 14:38
普林斯顿博士生高天宇指令微调进展速览:数据、算法和评估

普林斯顿博士生高天宇指令微调进展速览:数据、算法和评估

普林斯顿博士生高天宇指令微调进展速览:数据、算法和评估

自 ChatGPT 等大型语言模型推出以来,为了提升模型效果,各种指令微调方法陆续被提出。本文中,普林斯顿博士生、陈丹琦学生高天宇汇总了指令微调领域的进展,包括数据、算法和评估等。

来自主题: AI技术研报
8226 点击    2024-01-21 14:14
AI看视频自动找“高能时刻”|字节&中科院自动化所@AAAI 2024

AI看视频自动找“高能时刻”|字节&中科院自动化所@AAAI 2024

AI看视频自动找“高能时刻”|字节&中科院自动化所@AAAI 2024

字节跳动联合中科院自动化研究所提出新方法,用AI快速检测出视频中的高光片段,对输入视频的长度以及期望提取的高光长度都具有极高的灵活性,相关论文已被AAAI 2024收录。

来自主题: AI资讯
5926 点击    2024-01-21 14:02
一张照片,为深度学习巨头们定制人像图片

一张照片,为深度学习巨头们定制人像图片

一张照片,为深度学习巨头们定制人像图片

主题驱动的文本到图像生成,通常需要在多张包含该主题(如人物、风格)的数据集上进行训练,这类方法中的代表工作包括 DreamBooth、Textual Inversion、LoRAs 等,但这类方案因为需要更新整个网络或较长时间的定制化训练,往往无法很有效地兼容社区已有的模型,并无法在真实场景中快速且低成本应用。

来自主题: AI技术研报
10946 点击    2024-01-20 14:53
小扎砸数百亿美元猛攻开源AGI!狂掷60万块H100,爆50倍GPT-4算力

小扎砸数百亿美元猛攻开源AGI!狂掷60万块H100,爆50倍GPT-4算力

小扎砸数百亿美元猛攻开源AGI!狂掷60万块H100,爆50倍GPT-4算力

今天,小扎正式宣战「开源AGI」!下一代大模型Llama 3正在训练,年底将拥有35万块H100,届时算力总和达60万块H100。为了追赶OpenAI,成立十年的FAIR团队纳入GenAI,全力奔赴AGI。

来自主题: AI技术研报
7446 点击    2024-01-19 14:16