首个英文原生「弱智吧」!逻辑谬误数据集与生成框架来了 | AAAI'26
首个英文原生「弱智吧」!逻辑谬误数据集与生成框架来了 | AAAI'26最近研究发现,大模型在判断逻辑谬误时容易「想太多」,误报正常句子,但在确定有谬误后,其分类能力较强。研究人员构建了首个高质量英文逻辑谬误基准SMARTYPAT-BENCH,并开发了基于Prolog的逻辑谬误自动生成框架SMARTYPAT,为大模型逻辑能力评估提供新思路,可用于谬误识别、辩论教育等领域。
来自主题: AI技术研报
8857 点击 2025-12-05 09:19