AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
清华微软最新力作:用物理学革新Transformer注意力,「大海捞针」精度暴涨30%!

清华微软最新力作:用物理学革新Transformer注意力,「大海捞针」精度暴涨30%!

清华微软最新力作:用物理学革新Transformer注意力,「大海捞针」精度暴涨30%!

随着诺贝尔物理学奖颁给了「机器学习之父」Geoffrey Hinton,另一个借鉴物理学概念的模型架构也横空出世——微软清华团队的最新架构Differential Transformer,从注意力模块入手,实现了Transformer的核心能力提升。

来自主题: AI技术研报
7793 点击    2024-10-10 14:24
这篇论文非常火!差分Transformer竟能消除注意力噪声,犹如降噪耳机

这篇论文非常火!差分Transformer竟能消除注意力噪声,犹如降噪耳机

这篇论文非常火!差分Transformer竟能消除注意力噪声,犹如降噪耳机

Transformer 的强大实力已经在诸多大型语言模型(LLM)上得到了证明,但该架构远非完美,也有很多研究者致力于改进这一架构,比如机器之心曾报道过的 Reformer 和 Infini-Transformer。

来自主题: AI技术研报
6361 点击    2024-10-10 12:15
开发者火冒三丈炮轰GenAI:垃圾语料太多,模型正在变得越来越笨

开发者火冒三丈炮轰GenAI:垃圾语料太多,模型正在变得越来越笨

开发者火冒三丈炮轰GenAI:垃圾语料太多,模型正在变得越来越笨

生成式AI(GenAI),尤其是以OpenAI的ChatGPT为代表,人们发现,这些大模型在一年多后的性能表现远不及刚发布时那样令人惊艳了。

来自主题: AI资讯
3711 点击    2024-10-08 18:59
「乘法变加法」!MIT清华校友全新方法优化Transformer:Addition is All You Need

「乘法变加法」!MIT清华校友全新方法优化Transformer:Addition is All You Need

「乘法变加法」!MIT清华校友全新方法优化Transformer:Addition is All You Need

Transformer计算,竟然直接优化到乘法运算了。MIT两位华人学者近期发表的一篇论文提出:Addition is All You Need,让LLM的能耗最高降低95%。

来自主题: AI技术研报
4138 点击    2024-10-08 17:32
做语料交易平台,Cloudflare要为站长“主持公道”

做语料交易平台,Cloudflare要为站长“主持公道”

做语料交易平台,Cloudflare要为站长“主持公道”

这样一套组合拳打下去,AI厂商大概率就会乖乖向网站付费了。

来自主题: AI资讯
5517 点击    2024-10-08 17:18
ECCV2024 Oral | 第一视角下的动作图像生成,Meta等提出LEGO模型

ECCV2024 Oral | 第一视角下的动作图像生成,Meta等提出LEGO模型

ECCV2024 Oral | 第一视角下的动作图像生成,Meta等提出LEGO模型

如何基于用户的问题和当前场景的照片,生成同一场景下的第一视角的动作图像,从而更准确地指导用户执行下一步行动?

来自主题: AI资讯
4025 点击    2024-10-02 11:22
mini-GPT4o来了? 能看、能听、会说,还情感丰富的多模态全能助手EMOVA

mini-GPT4o来了? 能看、能听、会说,还情感丰富的多模态全能助手EMOVA

mini-GPT4o来了? 能看、能听、会说,还情感丰富的多模态全能助手EMOVA

EMOVA(EMotionally Omni-present Voice Assistant),一个能够同时处理图像、文本和语音模态,能看、能听、会说的多模态全能助手,并通过情感控制,拥有更加人性化的交流能力。

来自主题: AI资讯
3384 点击    2024-10-02 11:17