AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码

硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码

硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关键密码

自GPT-2以来,大模型的整体架构虽然未有大的变化,但从未停止演化的脚步。借OpenAI开源gpt-oss(120B/20B),Sebastian Raschka博士将我们带回硬核拆机现场,回溯了从GPT-2到gpt-oss的大模型演进之路,并将gpt-oss与Qwen3进行了详细对比。

来自主题: AI技术研报
8173 点击    2025-08-18 11:13
SEAgent:开启从实战经验中自我进化的GUI智能体新纪元

SEAgent:开启从实战经验中自我进化的GUI智能体新纪元

SEAgent:开启从实战经验中自我进化的GUI智能体新纪元

当前计算机使用智能体(CUA)的发展,主要依赖于大量昂贵的人工标注数据 。这极大地限制了它们在缺少现成数据的新颖或专业软件中的应用能力 。为了打破这一瓶颈,来自上海交通大学和香港中文大学的学者们提出了 SEAgent,一个全新的、无需任何人类干预,即可通过与环境交互来自主学习和进化的智能体框架。

来自主题: AI技术研报
7531 点击    2025-08-18 10:58
刚刚!谷歌内部揭秘Genie 3:Sora后最强AI爆款,开启世界模型新时代

刚刚!谷歌内部揭秘Genie 3:Sora后最强AI爆款,开启世界模型新时代

刚刚!谷歌内部揭秘Genie 3:Sora后最强AI爆款,开启世界模型新时代

Genie 3来了!这或许是最接近「模拟世界」的AI魔法。只需一句话,它就能生成一个动态、可互动的世界——角色能互动、下水会溅起水花,甚至还能记住一分钟前的细节。DeepMind研究者直言:Genie 3是通向AGI的关键一步。

来自主题: AI资讯
7444 点击    2025-08-18 10:54
大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大模型给自己当裁判并不靠谱!上海交通大学新研究揭示LLM-as-a-judge机制缺陷

大语言模型(LLM)正从工具进化为“裁判”(LLM-as-a-judge),开始大规模地评判由AI自己生成的内容。这种高效的评估范式,其可靠性与人类判断的一致性,却很少被深入验证。

来自主题: AI技术研报
6763 点击    2025-08-17 13:16
混合数学编程逻辑数据,一次性提升AI多领域强化学习能力 | 上海AI Lab

混合数学编程逻辑数据,一次性提升AI多领域强化学习能力 | 上海AI Lab

混合数学编程逻辑数据,一次性提升AI多领域强化学习能力 | 上海AI Lab

近年来,AI大模型在数学计算、逻辑推理和代码生成领域的推理能力取得了显著突破。特别是DeepSeek-R1等先进模型的出现,可验证强化学习(RLVR)技术展现出强大的性能提升潜力。

来自主题: AI技术研报
7077 点击    2025-08-16 16:45
模仿人类推理修正过程,阶跃星辰提出形式化证明新范式 | 开源

模仿人类推理修正过程,阶跃星辰提出形式化证明新范式 | 开源

模仿人类推理修正过程,阶跃星辰提出形式化证明新范式 | 开源

形式化定理证明,又有新范式! 阶跃星辰正式发布并开源了形式化定理证明大模型:StepFun-Prover-Preview-7B和StepFun-Prover-Preview-32B。

来自主题: AI技术研报
8061 点击    2025-08-16 16:10
追剧不断网,可能背后有个AI在加班,故障诊断准度破91.79%

追剧不断网,可能背后有个AI在加班,故障诊断准度破91.79%

追剧不断网,可能背后有个AI在加班,故障诊断准度破91.79%

当你的手机突然没信号时,电信工程师在做什么? 想象一下这样的场景:某个周五晚上,你正在用手机追剧,突然网络断了。与此同时,成千上万的用户也遇到了同样的问题。电信运营商的监控中心瞬间被数百个告警信息淹没 —— 基站离线、信号中断、设备故障…

来自主题: AI技术研报
5963 点击    2025-08-16 15:57