AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
Transformer作者初创重磅发布Transformer²!AI模型活了,动态调整自己权重

Transformer作者初创重磅发布Transformer²!AI模型活了,动态调整自己权重

Transformer作者初创重磅发布Transformer²!AI模型活了,动态调整自己权重

Sakana AI发布了Transformer²新方法,通过奇异值微调和权重自适应策略,提高了LLM的泛化和自适应能力。新方法在文本任务上优于LoRA;即便是从未见过的任务,比如MATH、HumanEval和ARC-Challenge等,性能也都取得了提升。

来自主题: AI技术研报
8469 点击    2025-01-16 10:23
Transformer²要做「活」的AI模型,动态调整权重,像章鱼一样适应环境

Transformer²要做「活」的AI模型,动态调整权重,像章鱼一样适应环境

Transformer²要做「活」的AI模型,动态调整权重,像章鱼一样适应环境

自适应 LLM 反映了神经科学和计算生物学中一个公认的原理,即大脑根据当前任务激活特定区域,并动态重组其功能网络以响应不断变化的任务需求。

来自主题: AI技术研报
5136 点击    2025-01-15 18:30
AI 公司是真「饿了」,开始砸钱买你拍的「废片」

AI 公司是真「饿了」,开始砸钱买你拍的「废片」

AI 公司是真「饿了」,开始砸钱买你拍的「废片」

做过 Up 主、YouTuber 或是视频自媒体从业者都知道,一部传到平台上 10 分钟的成片,背后可能是几个小时的素材。

来自主题: AI资讯
8493 点击    2025-01-15 14:42
仅缩小视觉Token位置编码间隔,轻松让多模态大模型理解百万Token!清华大学,香港大学,上海AI Lab新突破

仅缩小视觉Token位置编码间隔,轻松让多模态大模型理解百万Token!清华大学,香港大学,上海AI Lab新突破

仅缩小视觉Token位置编码间隔,轻松让多模态大模型理解百万Token!清华大学,香港大学,上海AI Lab新突破

随着语言大模型的成功,视觉 - 语言多模态大模型 (Vision-Language Multimodal Models, 简写为 VLMs) 发展迅速,但在长上下文场景下表现却不尽如人意,这一问题严重制约了多模态模型在实际应用中的潜力。

来自主题: AI技术研报
7267 点击    2025-01-15 14:23
余弦相似度可能没用?对于某些线性模型,相似度甚至不唯一

余弦相似度可能没用?对于某些线性模型,相似度甚至不唯一

余弦相似度可能没用?对于某些线性模型,相似度甚至不唯一

在机器学习和数据科学领域,余弦相似度长期以来一直是衡量高维对象之间语义相似度的首选指标。余弦相似度已广泛应用于从推荐系统到自然语言处理的各种应用中。它的流行源于人们相信它捕获了嵌入向量之间的方向对齐,提供了比简单点积更有意义的相似性度量。

来自主题: AI技术研报
7456 点击    2025-01-14 14:47
思维链?思维树?华为诺亚:现在到了思维森林时刻!

思维链?思维树?华为诺亚:现在到了思维森林时刻!

思维链?思维树?华为诺亚:现在到了思维森林时刻!

OpenAI 接连发布 o1 和 o3 模型,大模型的高阶推理能力正在迎来爆发式增强。在预训练 Scaling law “撞墙” 的背景下,探寻新的 Scaling law 成为业界关注的热点。高阶推理能力有望开启新的 Scaling law,为大模型的发展注入新的活力。

来自主题: AI技术研报
6768 点击    2025-01-14 14:43
同时提升摄像机控制效率、视频质量,可控视频生成架构AC3D来了

同时提升摄像机控制效率、视频质量,可控视频生成架构AC3D来了

同时提升摄像机控制效率、视频质量,可控视频生成架构AC3D来了

AC3D 从基本原理出发,分析了摄像机运动在视频生成中的特点,并通过以下三方面改进了视频生成的效果和效率:

来自主题: AI技术研报
6490 点击    2025-01-14 14:36
微软华人团队最新研究:从LLM到LAM,让大模型真正具有「行动力」!

微软华人团队最新研究:从LLM到LAM,让大模型真正具有「行动力」!

微软华人团队最新研究:从LLM到LAM,让大模型真正具有「行动力」!

AI大模型正从仅会聊天的LLM进化为能够执行任务的大型行动模型LAM。它不仅能理解用户的指令,还能在软件环境中自主执行任务。

来自主题: AI技术研报
6889 点击    2025-01-14 14:31
让「幻觉」无处遁形!谷歌DeepMind全新基准,三代Gemini同台霸榜

让「幻觉」无处遁形!谷歌DeepMind全新基准,三代Gemini同台霸榜

让「幻觉」无处遁形!谷歌DeepMind全新基准,三代Gemini同台霸榜

谷歌推出的FACTS Grounding基准测试,能评估AI模型在特定上下文中生成准确文本的能力,有助于提升模型的可靠性;通过去除不满足用户需求的回复,确保了评分的准确性和模型排名的公正性。

来自主题: AI技术研报
8678 点击    2025-01-13 13:47