AI资讯新闻榜单内容搜索-2

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 2
正交化之外是什么?微软等提出ARO优化器:训练提速1/3,揭示矩阵优化新「蓝海」

正交化之外是什么?微软等提出ARO优化器:训练提速1/3,揭示矩阵优化新「蓝海」

正交化之外是什么?微软等提出ARO优化器:训练提速1/3,揭示矩阵优化新「蓝海」

如果你在过去一年关注过大模型训练的技术,大概率听过 Muon 这个名字 —— 这个在月之暗面 K2 模型的相关讨论中走红的优化器,被视为是可能挑战 Adam 的新秀。它的思路很直接:对动量矩阵进行正交化,让各个奇异方向上的更新速率一致,提升训练效率。

来自主题: AI技术研报
6281 点击    2026-03-10 14:31
刚刚,智谱砍掉OpenClaw最大门槛!1分钟装好AutoClaw(澳龙),一键塞进飞书

刚刚,智谱砍掉OpenClaw最大门槛!1分钟装好AutoClaw(澳龙),一键塞进飞书

刚刚,智谱砍掉OpenClaw最大门槛!1分钟装好AutoClaw(澳龙),一键塞进飞书

OpenClaw爆火但安装门槛极高,催生天价代装生意。AutoClaw(澳龙),将其打包为一键安装桌面应用,小白也能1分钟上手。内置全新Agent模型Pony-Alpha-2,支持模型热插拔与飞书集成,50+技能开箱即用,彻底终结「付费装虾」时代。

来自主题: AI资讯
10782 点击    2026-03-10 11:37
ICLR 2026|早于DeepSeek Engram,STEM已重构Transformer「记忆」

ICLR 2026|早于DeepSeek Engram,STEM已重构Transformer「记忆」

ICLR 2026|早于DeepSeek Engram,STEM已重构Transformer「记忆」

近年来,随着大语言模型规模与知识密度不断提升,研究者开始重新思考一个更本质的问题:模型中的参数应如何被组织,才能更高效地充当「记忆」。

来自主题: AI技术研报
8277 点击    2026-03-10 09:31
ICLR2026 Oral | 北大彭一杰团队提出高效优化新范式,递归似然比梯度优化器赋能扩散模型后训练

ICLR2026 Oral | 北大彭一杰团队提出高效优化新范式,递归似然比梯度优化器赋能扩散模型后训练

ICLR2026 Oral | 北大彭一杰团队提出高效优化新范式,递归似然比梯度优化器赋能扩散模型后训练

在 AI 视觉生成领域,扩散模型(DM)凭借其强大的高保真数据生成能力,已成为图像合成、视频生成等多模态任务的核心框架。然而,预训练后的扩散模型如何高效适配下游应用需求,一直是行业面临的关键挑战。

来自主题: AI技术研报
7825 点击    2026-03-10 09:30
3B打32B?海外病毒式传播的小模型,竟然来自BOSS直聘

3B打32B?海外病毒式传播的小模型,竟然来自BOSS直聘

3B打32B?海外病毒式传播的小模型,竟然来自BOSS直聘

这两年,大模型大厂之间堪比军备竞赛。不论开源还是闭源阵营,为了在指标上领先对手,都在疯狂地卷 Scaling Law,卷算力,卷参数量,已经达到了近乎离谱的程度。

来自主题: AI技术研报
8554 点击    2026-03-09 16:23
无锡发布“养龙虾”12条

无锡发布“养龙虾”12条

无锡发布“养龙虾”12条

无锡高新区发布《关于支持OpenClaw等开源社区项目与OPC社区融合发展的若干措施(征集意见稿)》。 12条“养龙虾”政策,从基础支持到产业落地,从人才引育到安全合规,单项支持最高达500万

来自主题: AI监管政策
8363 点击    2026-03-09 15:42
OpenAI测谎13款大模型:Claude 3.7封神,GPT-5.2近乎失控!

OpenAI测谎13款大模型:Claude 3.7封神,GPT-5.2近乎失控!

OpenAI测谎13款大模型:Claude 3.7封神,GPT-5.2近乎失控!

OpenAI的最新研究揭示了一个反直觉的真相:越强大的推理模型,越管不住自己的「脑子」。在CoT-Control套件测试的13款前沿模型中,DeepSeek R1控制自身思维链的成功率仅为0.1%,Claude Sonnet 4.5也只有2.7%。

来自主题: AI资讯
9189 点击    2026-03-09 15:08