AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
顶尖模型离“科学家”还差得远?AI4S亟待迈向2.0时代

顶尖模型离“科学家”还差得远?AI4S亟待迈向2.0时代

顶尖模型离“科学家”还差得远?AI4S亟待迈向2.0时代

周伯文还详细介绍了上海 AI 实验室近年来开展的前沿探索与实践,包括驱动 “通专融合” 发展的技术架构 ——“智者”SAGE(Synergistic Architecture for Generalizable Experts),其包含基础、融合与进化三个层次,并可双向循环实现全栈进化;支撑 AGI4S 探索的两大基础设施“书生”科学多模态大模型 Intern-S1、“

来自主题: AI资讯
9014 点击    2026-01-30 19:13
速递|初创公司Arcee AI低成本六个月训练,发布4000亿参数开源大模型Trinity

速递|初创公司Arcee AI低成本六个月训练,发布4000亿参数开源大模型Trinity

速递|初创公司Arcee AI低成本六个月训练,发布4000亿参数开源大模型Trinity

行业内许多人认为AI 模型市场的赢家早已确定:大型科技公司将主导市场(谷歌、Meta、微软,以及部分亚马逊业务)并联合其选择的模型开发商,主要是 OpenAI 和 Anthropic。

来自主题: AI资讯
9355 点击    2026-01-30 16:12
LLM-in-Sandbox:给大模型一台电脑,激发通用智能体能力

LLM-in-Sandbox:给大模型一台电脑,激发通用智能体能力

LLM-in-Sandbox:给大模型一台电脑,激发通用智能体能力

大模型的能力正在被不同的范式逐步解锁:In-Context Learning 展示了模型无需微调即可泛化到新任务;Chain-of-Thought 通过引导模型分步推理来提升复杂问题的求解能力;近期,智能体框架则赋予模型调用工具、多轮交互的能力。

来自主题: AI技术研报
9620 点击    2026-01-30 16:05
大模型学会拖进度条看视频了!阿里新研究让视频推理告别脑补,实现证据链思考 | ICLR 2026

大模型学会拖进度条看视频了!阿里新研究让视频推理告别脑补,实现证据链思考 | ICLR 2026

大模型学会拖进度条看视频了!阿里新研究让视频推理告别脑补,实现证据链思考 | ICLR 2026

为什么让多模态大模型“一步一步思考”(”Let’s think step by step”)来回答视频问题,效果有时甚至还不如让它“直接回答”?

来自主题: AI技术研报
8555 点击    2026-01-30 09:56
先建“语义基座”,再谈运维智能!阿里云以 Operation Intelligence 定义 AIOps 新范式

先建“语义基座”,再谈运维智能!阿里云以 Operation Intelligence 定义 AIOps 新范式

先建“语义基座”,再谈运维智能!阿里云以 Operation Intelligence 定义 AIOps 新范式

大模型的出现,给许多行业带来了颠覆性的改变,运维这个向来被视为稳定、保守的领域也不例外。虽然“AIOps”这个概念早在 2016 年由 Gartner 提出,但早期的智能运维更多是利用大数据和机器学习对传统运维流程进行效率上的提升。

来自主题: AI资讯
7269 点击    2026-01-29 15:21
Agent学会“预测同伴”,神经网络里涌现出了类社会位置细胞

Agent学会“预测同伴”,神经网络里涌现出了类社会位置细胞

Agent学会“预测同伴”,神经网络里涌现出了类社会位置细胞

近日,香港城市大学博士生方政儒和所在团队让一群智能体在虚拟迷宫里共同探索,只给它们一个极其简单的目标——那就是学会预测同伴下一秒会看到什么以及会走到哪里。结果发现这些智能体不仅学会了高效合作,还在自己的“大脑”里自发形成了类似动物大脑中的“地图细胞”,甚至发明了一套只有它们才懂的秘密语言。

来自主题: AI资讯
9160 点击    2026-01-29 14:57
JustGRPO:扩散语言模型的极简主义回归

JustGRPO:扩散语言模型的极简主义回归

JustGRPO:扩散语言模型的极简主义回归

扩散语言模型(Diffusion LLMs, dLLMs)因支持「任意顺序生成」和并行解码而备受瞩目。直觉上,打破传统自回归(AR)「从左到右」的束缚,理应赋予模型更广阔的解空间,从而在数学、代码等复杂任务上解锁更强的推理潜力。

来自主题: AI技术研报
9781 点击    2026-01-29 14:55
斯坦福实测GPT-5与Claude 4.5“双盲实验。AI编程,没有协作类产品的原因找到了

斯坦福实测GPT-5与Claude 4.5“双盲实验。AI编程,没有协作类产品的原因找到了

斯坦福实测GPT-5与Claude 4.5“双盲实验。AI编程,没有协作类产品的原因找到了

为什么在LLM推理能力大幅跃升的2026,我们依然只有AI Copilot而没有AI Teammate?尽管AI编程工具遍地开花,但不管是Claude Code还是Codex,本质上仍是“单Agent开发”或“主从控制”架构。而“AI结对编程”迟迟无法落地?

来自主题: AI技术研报
7312 点击    2026-01-29 10:10