AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
官方揭秘ChatGPT Agent背后原理!通过强化学习让模型自主探索最佳工具组合

官方揭秘ChatGPT Agent背后原理!通过强化学习让模型自主探索最佳工具组合

官方揭秘ChatGPT Agent背后原理!通过强化学习让模型自主探索最佳工具组合

在正式走近ChatGPT Agent之前,让我们介绍一下这次谈话的几位主角,他们分别是OpenAI团队核心成员Isa Fulford、Casey Chu和孙之清。我们团队分别开发了Operator和Deep Research,在分析用户请求时发现,Deep Research的用户非常希望模型能够访问需要付费订阅的内容或有门槛的资源,而Operator恰好具备这种能力。

来自主题: AI资讯
7610 点击    2025-07-24 09:50
四款扩散大语言模型全部破防?上交&上海AI Lab发现致命安全缺陷

四款扩散大语言模型全部破防?上交&上海AI Lab发现致命安全缺陷

四款扩散大语言模型全部破防?上交&上海AI Lab发现致命安全缺陷

扩散语言模型(Diffusion-based LLMs,简称 dLLMs)以其并行解码、双向上下文建模、灵活插入masked token进行解码的特性,成为一个重要的发展方向。

来自主题: AI技术研报
7512 点击    2025-07-23 15:04
首个统一「图像/视频」自适应语义分割框架来了!QuadMix刷榜多项基准

首个统一「图像/视频」自适应语义分割框架来了!QuadMix刷榜多项基准

首个统一「图像/视频」自适应语义分割框架来了!QuadMix刷榜多项基准

东北大学、武汉大学等的研究人员首次提出统一处理图像与视频的无监督领域自适应语义分割框架,通过四向混合机制(QuadMix)和光流引导的时空聚合模块,有效缩小跨域差异,显著提升模型性能,刷新多项基准记录。该方法不仅解决了图像与视频任务割裂的问题,还为未来多模态感知系统奠定了基础。

来自主题: AI资讯
5817 点击    2025-07-23 13:47
ICML2025|清华医工平台提出大模型「全周期」医学能力评测框架MultiCogEval

ICML2025|清华医工平台提出大模型「全周期」医学能力评测框架MultiCogEval

ICML2025|清华医工平台提出大模型「全周期」医学能力评测框架MultiCogEval

大语言模型(Large Language Models,LLMs)技术的迅猛发展,正在深刻重塑医疗行业。医疗领域正成为这一前沿技术的 “新战场” 之一。大模型具备强大的文本理解与生成能力,能够快速读取医学文献、解读病历记录,甚至基于患者表述生成初步诊断建议,有效辅助医生提升诊断的准确性与效率。

来自主题: AI技术研报
5567 点击    2025-07-23 13:25
3D生成补上物理短板!首个系统性标注物理3D数据集上线,还有一个端到端框架

3D生成补上物理短板!首个系统性标注物理3D数据集上线,还有一个端到端框架

3D生成补上物理短板!首个系统性标注物理3D数据集上线,还有一个端到端框架

3D生成又补齐了一块重要拼图——物理属性! 南洋理工大学-商汤联合研究中心S-Lab,及上海人工智能实验室合作提出了PhysXNet,号称首个系统性标注的物理基础3D数据集。

来自主题: AI技术研报
5903 点击    2025-07-23 13:18
a16z圆桌洞察|软件开发的第四次革命,当AI成为基础设施的新支柱

a16z圆桌洞察|软件开发的第四次革命,当AI成为基础设施的新支柱

a16z圆桌洞察|软件开发的第四次革命,当AI成为基础设施的新支柱

你有没有想过,我们正在见证软件史上最深刻的一次变革?不是什么渐进式的改进,而是一场颠覆性的革命。

来自主题: AI技术研报
7504 点击    2025-07-23 10:28
超越Claude 3.5和o1!8B模型靠「分层投票+测试时训练」逆袭

超越Claude 3.5和o1!8B模型靠「分层投票+测试时训练」逆袭

超越Claude 3.5和o1!8B模型靠「分层投票+测试时训练」逆袭

小时候完成月考测试后,老师会通过讲解考试卷中吃错题让同学们在未来取得好成绩。

来自主题: AI技术研报
7481 点击    2025-07-23 10:20
重塑注意力机制:GTA登场,KV缓存缩减70%、计算量削减62.5%

重塑注意力机制:GTA登场,KV缓存缩减70%、计算量削减62.5%

重塑注意力机制:GTA登场,KV缓存缩减70%、计算量削减62.5%

GTA 工作由中国科学院自动化研究所、伦敦大学学院及香港科技大学(广州)联合研发,提出了一种高效的大模型框架,显著提升模型性能与计算效率。

来自主题: AI技术研报
7391 点击    2025-07-23 10:15