ChatGPT爱用破折号是病,奥特曼刚宣布已经治好了

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
ChatGPT爱用破折号是病,奥特曼刚宣布已经治好了
7664点击    2025-11-16 13:22

奥特曼又又又亲自官宣了ChatGPT的一项“重要更新”——


从现在起,你的ChatGPT可以听从指示,在输出内容中不再滥用破折号。


ChatGPT爱用破折号是病,奥特曼刚宣布已经治好了


为啥一个普通的标点符号,能让奥特曼亲自宣传,而且还极具热度呢?


因为在这之前,ChatGPT实在是太喜欢用破折号了,以至于这个标点成了人们判断AI生成内容的一个标志。


再加上之前的ChatGPT在这个问题上不是很听话,即便要求它不要加破折号,结果依然我行我素。


现在呢,按照奥特曼的说法,这个问题已经被修复了。


不过颇具黑色幽默的是,有网友告诉ChatGPT别用破折号,结果ChatGPT就明晃晃地在“知道了”后面加上了一个。


ChatGPT爱用破折号是病,奥特曼刚宣布已经治好了


破折号困扰OpenAI


ChatGPT对破折号的“痴迷”早已让用户不胜其烦。


在OpenAI的官方论坛上,充斥着大量用户的吐槽帖子。许多人抱怨,无论他们如何在自定义指令中恳求甚至威胁,AI依然会顽固地在回复中插入破折号和不必要的缩进。


这种标志性的写作习惯,几乎成了AI生成的标志,使其文本AI味十足,极易被识别。


用户们为了治好这个毛病,可谓想尽了办法,甚至使用了戏剧性的情感提示词(Emotional Prompt),但收效甚微。


ChatGPT爱用破折号是病,奥特曼刚宣布已经治好了


事实上,破折号只是AI写作标记中广为人知的一个。


在相关的Threads讨论中,有用户进一步总结了AI写作的其它“怪癖”。


这包括过度依赖列表和子标题,仿佛不分点论述就无法思考、滥用像“不仅是X,也是Y”这样的特定重复句式等等。


这些AI标记简直像是可被轻易识别的、难以擦除的“数字水印”。


ChatGPT爱用破折号是病,奥特曼刚宣布已经治好了


不过也有人对这些“AI标记”持不同看法。有人指出,人们对“AI味”的抵制有些过度,甚至非理性地憎恨任何与AI相关的事物已成为一种趋势。


ChatGPT爱用破折号是病,奥特曼刚宣布已经治好了


但归根结底,一手造成破折号被污名化的,依然还是ChatGPT自身。


ChatGPT爱用破折号是病,奥特曼刚宣布已经治好了


不过,到底是为什么,破折号如此受到AI的权利呢?


为啥AI喜欢破折号


GitHub软件工程师Sean Goedecke的一篇博客,对这个问题进行了研究。


博客从一些简单猜想开始分析,一开始给出的猜测包括破折号本身就常见,并且破折号功能丰富,而且AI更倾向于简洁性表达


但这些猜想很快被一一否定——


  • 关于常见性,如果破折号很常见,那么就不会成为引人注意的“AI象征”;
  • 对于功能,虽然破折号作用确实很多,但其他标点符号也具有相似的灵活性;
  • 至于简洁性,逗号比破折号更加简洁,而且减少冗余内容比换标点更好用。


接着,Sean把目光投向了大模型后训练中的一个重要环节——RLHF。


他推测,AI对破折号的偏爱极有可能来自于RLHF信息提供者的语言习惯


博客指出,RLHF通常在肯尼亚、尼日利亚等低人力成本、高英语水平的非洲国家进行,因此AI的习惯会和这些地区的人相似。


比如像“delve”这样的词汇,在非洲英语中就非常受青睐,结果AI也同样高频使用。


但这个猜想并不能解释破折号被AI喜欢的原因,因为非洲英语当中破折号的使用频率,反而低于平均水平,甚至连十分之一都不到。


接下来,Sean介绍了一个重要发现——GPT并非从一开始就喜欢破折号,而是从GPT-4开始,使用频率比之前增长了十倍


所以,问题大概率就出在3.5和4之间的这一段时期了。那么这段时间里发生了什么呢?


彼时,AI的训练正在面临“数据荒”,人们开始千方百计地给AI寻找新的训练数据。


其中一个手段,就是扫描19世纪末到20世纪初的纸质书籍,然后喂给AI。


同时,Sean找到了一个关于英语标点符号使用频率的研究,发现这段时间刚好是破折号的使用高峰


比如1851年美国小说家赫尔曼的《白鲸记》(Moby-Dick)当中,一共有1728个破折号。


Sean认为,尽管还有一些问题未被解释,但19世纪出版物的引入,有很大概率就是AI好用破折号的“幕后黑手”。


参考链接:

[1]https://x.com/sama/status/1989193813043069219

[2]https://techcrunch.com/2025/11/14/openai-says-its-fixed-chatgpts-em-dash-problem/

[3]https://www.seangoedecke.com/em-dashes/


文章来自于微信公众号 “量子位”,作者 “量子位”

关键词: AI新闻 , ChatGPT , openai , 人工智能
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0