AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
大模型训练遭投毒损失千万美元?Anthropic惊人发现:LLM植入炸弹,代码库暗藏bug!

大模型训练遭投毒损失千万美元?Anthropic惊人发现:LLM植入炸弹,代码库暗藏bug!

大模型训练遭投毒损失千万美元?Anthropic惊人发现:LLM植入炸弹,代码库暗藏bug!

最近,大模型训练遭恶意攻击事件已经刷屏了。就在刚刚,Anthropic也发布了一篇论文,探讨了前沿模型的巨大破坏力,他们发现:模型遇到危险任务时会隐藏真实能力,还会在代码库中巧妙地插入bug,躲过LLM和人类「检查官」的追踪!

来自主题: AI技术研报
3773 点击    2024-10-19 16:24
深度 | OpenAI新董事兼CMU机器学习系主任:虽然数据有限,但AI性能不会停滞不前;LLM行业很可能会整合

深度 | OpenAI新董事兼CMU机器学习系主任:虽然数据有限,但AI性能不会停滞不前;LLM行业很可能会整合

深度 | OpenAI新董事兼CMU机器学习系主任:虽然数据有限,但AI性能不会停滞不前;LLM行业很可能会整合

虽然数据有限,但AI性能不会停滞不前,我们当前的算法还没有从我们拥有的数据中最大限度地提取信息,还有更多的推论、推断和其他过程我们可以应用到我们当前的数据上,以提供更多的价值。

来自主题: AI资讯
7559 点击    2024-10-19 14:41
又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!

又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!

又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!

又快又准,即插即用!清华8比特量化Attention,两倍加速于FlashAttention2,各端到端任务均不掉点!

来自主题: AI技术研报
9040 点击    2024-10-19 14:15
Bengio团队新论文!KL正则化有漏洞,强化学习新策略:不要做我可能不会做的事情

Bengio团队新论文!KL正则化有漏洞,强化学习新策略:不要做我可能不会做的事情

Bengio团队新论文!KL正则化有漏洞,强化学习新策略:不要做我可能不会做的事情

在强化学习中,当智能体的奖励机制与设计者的意图不一致时,可能会导致不理想的行为,而KL正则化作为一种常用的解决方案,通过限制智能体的行为来防止这种情况,但智能体在某些情况下仍可能表现出意料之外的行为;为了提高智能体的可靠性,研究人员提出了新的理论方案,通过改变指导原则来增强智能体在未知情况下的谨慎性。

来自主题: AI技术研报
6366 点击    2024-10-19 13:55
以图灵机为师:通过微调训练让大语言模型懂执行计算过程

以图灵机为师:通过微调训练让大语言模型懂执行计算过程

以图灵机为师:通过微调训练让大语言模型懂执行计算过程

大型语言模型 (LLM) 在各种自然语言处理和推理任务中表现出卓越的能力,某些应用场景甚至超越了人类的表现。然而,这类模型在最基础的算术问题的表现上却不尽如人意。

来自主题: AI技术研报
4491 点击    2024-10-18 13:54
大模型步入「推理Scaling」时代,SambaNova如何挑战英伟达的霸主地位?

大模型步入「推理Scaling」时代,SambaNova如何挑战英伟达的霸主地位?

大模型步入「推理Scaling」时代,SambaNova如何挑战英伟达的霸主地位?

OpenAI o1 的发布,再次给 AI 领域带来了一场地震。 o1 能像人类一样「思考」复杂问题,拥有优秀的通用推理能力。在未经专门训练的情况下,o1 能够直接拿下数学奥赛金牌,甚至能在博士级别的科学问答环节上超越人类专家。

来自主题: AI资讯
3586 点击    2024-10-18 13:43
NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型TopoFR

NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型TopoFR

NeurIPS 2024 | FaceChain团队新作,开源拓扑对齐人脸表征模型TopoFR

在数字人领域,形象的生成需要依赖于基础的表征学习。FaceChain 团队除了在数字人生成领域持续贡献之外,在基础的人脸表征学习领域也一直在进行深入研究。

来自主题: AI技术研报
5448 点击    2024-10-18 11:09
全模态对齐框架align-anything来了:实现跨模态指令跟随

全模态对齐框架align-anything来了:实现跨模态指令跟随

全模态对齐框架align-anything来了:实现跨模态指令跟随

如何全模态大模型与人类的意图相对齐,已成为一个极具前瞻性且至关重要的挑战。

来自主题: AI技术研报
7722 点击    2024-10-18 10:53
GPU泡沫破灭前夜:2美元/小时出租,H100算力价格暴跌75%

GPU泡沫破灭前夜:2美元/小时出租,H100算力价格暴跌75%

GPU泡沫破灭前夜:2美元/小时出租,H100算力价格暴跌75%

红杉资本的报告曾指出,AI产业的年产值超过6000亿美元,才够支付数据中心、加速GPU卡等AI基础设施费用。而现在一种普遍说法认为,基础模型训练的资本支出是“历史上贬值最快的资产”,但关于GPU基础设施支出的判定仍未出炉,GPU土豪战争仍在进行。

来自主题: AI资讯
5832 点击    2024-10-18 10:02