你的论文有novelty吗?复旦搞了个顶会论文查新系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
你的论文有novelty吗?复旦搞了个顶会论文查新系统
7849点击    2026-01-19 16:45

ICLR 2026 的 Rebuttal 结束了。当 OpenReview 上的喧嚣散去,我们发现,作者与审稿人之间漫长的拉锯战,最终往往只剩下一个核心分歧:「这个想法,以前真的没人做过吗?」


Novelty(创新性)是学术评审中被高度关注的指标之一, 但其评估在实践中仍高度依赖评审者的经验判断与检索覆盖。随 arXiv 文献数量的快速增长,仅靠人工检索与记忆来追溯相关研究工作,已难以满足高效的评审需求。


你的论文有novelty吗?复旦搞了个顶会论文查新系统


针对这一挑战,复旦大学 NLP 研究团队与其此前孵化的学术搜索平台 WisPaper 展开合作,共同研发了 OpenNovelty——一个基于大语言模型、强调证据与可验证性的自动化新颖性分析系统。


你的论文有novelty吗?复旦搞了个顶会论文查新系统


  • 论文标题:OpenNovelty: An LLM-powered Agentic System for Verifiable Scholarly Novelty Assessment
  • 论文链接:https://arxiv.org/abs/2601.01576
  • Github 链接:https://github.com/january-blue/OpenNovelty
  • HuggingFace:https://huggingface.co/papers/2601.01576
  • 官方网站:https://www.opennovelty.org


核心设计


OpenNovelty 的根本原则很简单:任何关于「该论文创新性不足」的判断,都必须附带可追溯的真实证据,这些证据必须来自于已发表的文献,并且能精确定位到原文具体段落。若系统未能找到相关证据,则如实说明「未发现支持该判断的证据」。


与传统查重仅关注文字表层重叠不同,OpenNovelty 试图解决语义层面的重复。 系统会对投稿进行结构化抽取,将作者表述转写为更便于检索与对比的学术概念短句,自动提取出论文的一个核心任务(Core Task)和若干具体贡献(Contributions)。


此外,系统还采用了「查询扩展(Query Expansion)」机制,针对提取出的每条信息,生成多个语义等价的变体,在 WisPaper 的索引库中进行地毯式检索,防止单一表述带来的检索遗漏。


四步分析流程:

从论文提交到生成

可验证的新颖性评估报告


第一步:核心信息提取


系统从论文的标题、摘要和引言,精准地提取出两类信息:


  • 核心任务:论文拟解决的核心学术问题(例如:「基于多轮强化学习的 LLM 智能体长周期决策训练」);


  • 贡献声明:作者明确宣称的创新点,如新方法、框架、算法或理论形式化(例如:「一个支持多种强化学习算法的统一训练框架」)。


你的论文有novelty吗?复旦搞了个顶会论文查新系统


第二步:相关文献检索与筛选


基于提取的信息,系统自动生成一组学术搜索语句(包括同义词及变体表达,避免因措辞差异而遗漏相关文献),然后利用 WisPaper 学术引擎展开地毯式搜索。


初步检索可能召回数百至上千篇潜在相关论文,随后通过去重、时间过滤与筛除弱相关性文献等步骤,最终形成约 60–80 篇用于后续分析的候选论文集合。


你的论文有novelty吗?复旦搞了个顶会论文查新系统


第三步:层次化分析与证据比对


这是系统的核心分析环节。系统会基于核心任务召回的候选论文构建层次化 taxonomy(树状分类体系),以呈现目标论文在相关研究脉络中的位置。提供目标论文在候选研究脉络中的相对定位,供评审者快速浏览。


针对每条贡献声明,系统会在贡献召回的候选论文集合中进行逐篇对比,并尝试给出可核验的对应证据片段。比对的结果有如下三种:


  • 能反驳(can_refute):找到已发表的论文具有相似贡献,必须附带双方论文的原文摘录作为证据。


你的论文有novelty吗?复旦搞了个顶会论文查新系统


  • 无法反驳(cannot_refute):在当前检索范围内,未发现可质疑该创新贡献的文献。


  • 存疑(unclear):信息不足,无法判断。


关键在于:如果系统做出「能反驳」的判断,但其提供的证据(即摘录段落)无法在原论文中找到或匹配度过低,该判断会自动降级为「无法反驳」。


第四步:「新颖性调查报告」生成


系统整合前三阶段结果,生成包含以下模块的评估报告:


  • 论文的核心任务
  • 研究领域的分类体系
  • 每条创新声明的比对结果和证据
  • 综合的「新颖性评估」叙述


对于系统给出的关键判断,报告会尽量提供可追溯的候选文献与可核验的原文证据位置,便于评审者快速定位与人工复查。


你的论文有novelty吗?复旦搞了个顶会论文查新系统


系统部署与公开验证


截止到 1 月 16 日,团队已经在系统上分析了 1360 篇投稿,并且把所有生成的新颖性报告公开发布在其官方网站。任何人都可以查阅系统对某篇投稿的分析结果、检索到的相关文献以及判断依据。


团队计划进一步将分析规模扩展至 2000+ 篇投稿,此外,还将持续优化系统,计划将其应用于其他 AI 顶级会议,并对所收集的报告和评审证据进行深入分析。


OpenNovelty 的影响


对审稿人而言:它是一个辅助工具而非替代。系统可以帮助评审者梳理文献脉络,快速掌握一篇论文在领域中的位置,从而将更多精力集中于更需要人类专业判断的关键环节,如研究意义、方法严谨性等问题。


对论文作者而言:它可作为投稿前的自查工具。如果研究具备实质创新性,系统可以提供相关证据;如果漏引了重要文献,系统亦能指出问题。


对学术界而言:该系统提供了一种“可验证的新颖性评估”工程路径——用检索到的真实文献与贡献级证据对比来约束结论输出,让判断能够被追溯与复核,而不是停留在模型的无证据生成。推动 AI 成为负责人的知识引证者,而非不可靠的内容生成器。


仍需人类判断


团队在论文里也明确指出了系统的局限性:


  • 难以理解复杂的数学公式和图表——如果一篇论文的核心创新藏在一个复杂的方程式里,系统可能会错过;
  • 只能搜到被索引过的论文,可能错过未被收录的小众期刊或非英语出版物;
  • 「无法反驳」仅表示在「检索范围内未找到」,并不等于「确实不存在」。


因此,团队一再强调:这是辅助工具,而非决策主体。最终的学术判断,仍然要由人类审稿人完成。


结语


OpenNovelty 的出现带有某种实验性的克制。它并非试图取代现有的同行评审体系,而是作为一套第三方审计系统介入。在 Rebuttal 结束后的最终决策阶段,它负责清洗迷雾,向 AC 展示那些被淹没的证据,而将最终的价值判断权留给人类。


目前,ICLR 2026 的部分论文查新报告已在 OpenNovelty 官网开放查阅。对于即将在明年继续冲击顶会的科研人员来说,这或许是一个审视自己工作的新鲜视角。


文章来自于“机器之心”,作者 “机器之心”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md