在数字化时代,人工智能(AI)正引领创新的浪潮,深刻改变了各行各业。chatGPT作为其中的佼佼者,为学术写作领域注入了新的活力。本研报深入分析基于ChatGPT功能的AI论文代写商业项目,探讨其在AI时代的商业模式、竞争态势以及未来发展的前景。
1
论文代写由来已久。
2015年,中国高校传媒联盟随机调查了318名大学生。其中31.13%的大学生表示考虑过找人代写论文,73.9%的大学生身边出现过论文代写现象。“为何找人代写论文”的原因则多种多样,其中“工作压力大”、“考研出国忙”、“偷懒和拖延症”是几个最常见的理由。
据当时《中国科学报》的评估,2015年全国高等院校在校人数3500万人,论文代写产值已经超过10个亿。
2015年的论文代写市场还是采用比较传统的“人工代写”方式,平均客单价超过500块钱,而随着AI技术的完善,2023年以后将有一大部分需求是通过“AI写作”来完成的,这会让客单价迅速下降,同时让使用“AI写论文”的学生数量快速增长。
2023年,全国高等院校在校人数超过4400万人,以保守数据估计,5%的在校学生有论文代写需求,平均每个学生愿意为此花费100元,论文代写也有高达20亿的市场规模。
所以,论文代写不是一个存量的红海市场,它是一个由新技术介入而产生的增量的蓝海市场。当然,这是有窗口期的,窗口期有多长则取决于AI技术迭代的速度和市场上玩家在营销上的力度。
论文代写需求人数最多,需求最刚性的群体,毫无疑问是各高校本科研究生的毕业生。他们需要通过完成论文答辩来获取最终的学位证明。
尽管学生群体数量巨大,但这并不是论文代写需求的全部用户。
还有一小部分来自于体制内工作需要评各种职称的成年人,发表学术论文是他们完成评级的条件之一。虽然数量有限,但需求和大四学生一样刚性。
传统方式
满足用户需求传统的方式是“人工代写”。
业务流程一般是“用户寻找服务商—服务商接洽用户,介绍服务和收费标准—成交后,服务商会把论文需求转给自己的“论文撰写”团队——团队完成后再交付给用户。
为了保证服务质量,机构通常会承诺论文审核“不过不收费”,费用不会一次性收齐,开始只会收一部分费用,等到答辩通过之后再收取尾款。
一家传统的代写机构需要具备2种能力:
机构要有获取用户的能力,也就是推广获取流量的能力。
机构需要有稳定“输出论文”的能力,机构会根据需要,搭建自营撰写团队或者兼职撰写团队来完成。撰写团队通常是由有丰富论文写作经验的高校在校生或者毕业生组成的。
满足用户需求新的方式是利用“AI 代写”。
业务流程一般是“用户寻找AI写作软件——下载软件并付费——根据需求自己写提示词让AI软件完成论文写作。
在服务上,AI写作更多是用户自己根据需求,在工具上不断地进行提问,最终完成论文代写,AI工具平台的人工干预是非常少的。鉴于目前生成式人工智能技术尚不成熟,AI生产的论文质量相比人工代写还是有一定差距,不过这并不是不能弥补的,这部分内容我们将在后面的实现技术环节进行讨论。
一家AI工具公司需要具备2种能力:
显然,一家互联网公司,流量获取能力是必修课。
相比较传统代写机构,AI工具公司在供应链上则需要的是AI产品的研发能力。
两种商业模式的能力对比
对于做此类业务的公司来说,用AI技术取代人工完成供应链能力的优势是显而易见的。
尽管利用AI技术早期需要比较高的研发投入,但随着用户量的增长,互联网公司边际成本降低的优势就会显现出来,最终使用“AI技术”的公司,肯定要比使用“人工”的公司更有成本优势。
公司运营成本的降低,会推动终端服务售价降低,这让使用AI技术的公司可以承接对价格敏感的论文代写用户,这群用户也是这个市场的增量来源。
现阶段,“论文代写”市场是一个由“人工”不断向”人工+AI”,并最终完成“100%AI”过渡的阶段。
这是一个主打论文写作的AI APP,官方介绍其采用了第四代GPT大模型,但其实并没有说明具体使用的是chatGPT哪个版本,笔者倾向于其接入的是GPT 3.5的版本,毕竟4.0有提问限制且成本不可同日而语。
在其宣传中,量探APP可以一次生成5万字的长文章,规避了chatGPT单次生成字数的限制。
由于该APP并不提供免费试用,所以只能从其宣传视频中查看其功能。
针对“论文生成”,相较于chatGPT,量探APP做了2个优化:
第一个是用户输入论文标题之后,系统并不会一下就生成论文全文,而是先生成论文大纲,并且允许用户对大纲进行修改,修改确定;第二个是用户对于生成之后的论文可以进行“降重”,这在论文写作中也是一个必不可少的步骤。
这类优化通常是研发团队通过对预埋提示词来实现的,提示词写的好不好直接关系到内容生成的质量。
IOS渠道搜索“论文写作”关键词,能看到量探APP的推广。
在抖音上,量探有蓝V官方账号,粉丝数达到了2.5万,并且已经发布了81个作品。猜测其运营团队除了做宣传视频以外,在需求高峰期也会采用直播和买流量的方式进行推广。
根据第三方数据显示,量探APP截止到2023年8月24日,近一年IOS下载总量达到了12.6万。
峰值出现在2023年3月16日,当天下载量达到了惊人的2254个,这也是每年毕业季论文写作需求最旺盛的时刻。
尽管8月也已经不是论文写作的高峰了,但该APP依然有日均247的下载量。
量探采用是按字数收费的方式,同时也对时间进行了限制。
最便宜的是10万/30天,收费98元,这个收费对比chatGPT 3.5 API的调用费用并不算便宜。
以10%的付费转化率来计算,量探APP近一年营收将超过123.48万元(126000×10%×98),这个估算的数据还是比较保守的。
如果研发团队是一个小型团队,那么利润率还是很可观的。
相比较量探APP,茅茅虫写作的网站功能全部围绕论文写作来构建,是目前AI写论文里最垂直的一个应用。
根据官网描述,茅茅虫自己积累了超过10年的论文数据,并结合开源的人工智能模型进行预训练及微调。官网的描述还是有一定水分的,茅茅虫的运营公司是2023年5月才注册完成,网站备案也是6月份才完成的。很难想象过往10年,他们是如何在既没有公司主体,也没有需要运营的网站的情况下,是因为什么开始积累长达10年数据的。
当然,这不代表茅茅虫在AI论文生成方面做的不好。尽管茅茅虫团队乍一看实力有限,但实际上产品的体验是远超量探APP的。
目前茅茅虫写作只有PC端。注册完成,即可进行写作。
它支持从0开始生产,也支持自己有内容进行再生成。
对于论文的类型茅茅虫做了非常详细分类。
选择好分类后,用户需要输入“论文的标题”和“关键词”来给AI一个生成的方向。写好标题后,关键词是可以让系统推荐的。
在这个环节中,茅茅虫做了一个非常厉害且重要的创新——知识投喂!
使用过chatGPT的朋友肯定都知道,我们在让它生成内容之前,先给chatGPT发一点我们想要的内容素材,然后再让GPT生成内容,会明显发现生成的内容会更好。
很显然,茅茅虫对AI内容生成的规则很了解,并且把其优化在了使用流程当中,而且通过自己的内容渠道,为用户很方便的提供了素材。
功能体验到这,茅茅虫的体验就远超同类型APP了 。
点击下一步,系统给用户生成了论文摘要。
如果对摘要满意,则点击下一步,进入提纲生成,生成好的提纲用户可以自定义选择或者修改。
再次进入下一步,则开始生成论文正文内容。在这个环节茅茅虫做的也是非常不错,输出论文内容的同时,把文档格式也整理好了。
茅茅虫写作保留了比较传统的百度竞价的推广方式,搜索其品牌名称能够看到推广信息。
但其核心推广重心还是在抖音上。
官方号粉丝非常多,有11.9万,而且还建立了非常多的矩阵号,粉丝数好几个也都破万了。
并没有第三方能够看到茅茅虫网站流量的情况,但基于其抖音推广做的有声有色,其流量规模应该不会小于量探。
茅茅虫并不是按字数收费的,而是按篇收费,每篇论文68元,价格相对于量探还要贵很多。如果流量不小于量探,近一年营收也应该达到了百万级别。
目前AI写作工具都是通过先接入了chatGPT官方的API,然后再进行二次开发的来实现功能的。
通过对竞品的调研,我们发现AI论文生成至少还有2个地方有巨大的优化空间。
由于chatGPT受提示词和训练数据本身的限制,这导致生成的“论文”质量并不高,这也直接让AI论文能够服务用户数量有了比较大的限制。
chatGPT的官方也考虑到了一旦AI应用到具体领域,其原有的训练数据肯定在专业度上是不够的,为了让AI能够更加准确地回答用户的问题,chatGPT提供了自定义知识库的方式来加强AI的回答能力。
知识库是根据具体应用场景和需求,构建一个包含各种实际知识和信息的数据库。在论文生成的场景中,我们可以将“优质论文”知作为一个知识库,集成到GPT模型中,这就能极大的提升chatGPT生成的论文质量。知识库的搭建需要用到Transforme的技术,这对于研发人员的水平有一定要求。
论文数据的总量非常巨大,且国内论文并不完全是一个公开信息,有分类容易分辨论质量的内容都系统的存在于“知网”当中,所以获取论文优质内容,需要企业具备水平比较高的爬虫技术或者自己独特的论文内容渠道,否则即使搭建好知识库也是没用的。
除了论文质量问题,论文的“参考文献”也是一个问题。
一篇论文的完成除了正文部分以外,还要说明该论文具体参考了哪些前人的资料。这个资料不能瞎编,要真的能够对应上论文里的正文内容。很显然,现在AI论文生成还做不到这一点,而人工代写恰恰在这优势明显。
因为“人工代写”的方法就是从找“参考论文”开始的,代写者会根据要代写的主题,选择过往相关论文,然后把里面的内容抄出来再拼凑在一起。所以最终成文时,代写者会非常容易把”参考文献“编进去。
AI代写要想解决这个问题,就要重新设计“AI写论文”的流程,让AI写作跟人工写作的流程一样。
首先让AI根据论文主题去寻找对应的论文素材,很显然这一步需要系统里有对应素材才行,也就是需要解决“论文知识库”搭建和“优质论文数据源”2个问题,然后让AI在知识库中学习一下,在生成的论文就是参考过素材的内容,最后再让AI把参考的内容输出出来,就能够解决“参考文献”的问题。
在这个“酒香也怕巷子深”的时候,有的时候流量比产品服务本身更重要。
对于APP推广,传统的方式可以依靠应用市场投放,信息流媒体投放。优点在于花钱就可以有流量,操作相对简单,至于ROI就需要拿真金白银去测试了。缺点也很明显,推广投入的钱会比较多,而且没有“积累性”,不花钱就没有流量了。
对于传统的人工代写转型的公司,大家普遍过有电商类的渠道积累,比如淘宝咸鱼上就有大量围绕论文业务的店铺,这些公司对于“电商平台”的获客转化轻车熟路。 具备这样能力的公司,推广APP只需要调整一下获客流程,从电商平台引流到私域,然后推广自己的AI应用即可。缺点也很明显,这样的推广效率不高,而且APP的客单价不如人工代写,这会直接影响原来公司的营收。
其实,无论是新入场的AI公司,还是老的“人工代写”公司,如果大家具备自己的APP之后,都可以选择通过“抖音”发视频+直播的方式进行推广转化。竞品调研中,2家在抖音的发力是非常明显的,而且效果也不错。
政策风险
目前国内对于AI监管的政策倾向尚不明朗,这导致在技术层面是否能一直使用chatGPT这类模型存在风险。如果后续监管因为数据安全明确不能使用,则需要企业使用开源的LLM模型进行开发,则开发成本会急剧上升,且效果是否能达到chatGPT的水平也是未知数。
就论文写作而言,国内最近就《学位法》提交人大进行审议,AI代写一旦发现会被取消学位资格。这无疑是在监管上拒绝了AI写作的合规性。但是这项规定的执行会存在一定的难度,毕竟AI代写的内容应该如何判断现在并没有一个统一标准,而且随着AI的进化,AI生成的内容将跟人类一样,那个时候就没法做精准判断了。
从“政治正确”的角度出发,监管上AI代写一定是不合规的,但是执行起来有极大难度。全球经济萎缩的今天,AI作为一个难得的民营增长点,宏观政策也一定是开放的。所以,笔者认为短时间内,政策不会对行业造成实质性影响,但需要从业者关注行业动态。
道德风险
上到教育局,学校,下到老师家长,没有任何一个人希望学生在写论文或者完成作业时候利用AI代劳。
但人性不可逆,人性不可逆,人性不可逆!重要的事情说3遍!
不管周围人多反对,对于学生而言,能走的捷径是一米也不会少走的。
对于他来讲,大学就只是一个获取证书的地方,加上很多大学的教学和社会严重脱节,“自己认真写论文”这件事的实际意义有多大是存疑的。
既然存在道德风险,这个行业后续就可能会演变成一个“灰产”,最后像很多行业一样,上不了台面但可以闷声发大财。
综上所述
在2023年9月4日这个时间节点而言,AI论文写作的市场远没有到饱和阶段,无论是产品技术还是市场容量都有很大的增长空间。
每年3月份开始,将是这个行业的旺季。
技术实现难度也相对有限,远没有到高不可攀的地步,而且由于行业具有道德风险,这让技术实力充沛的大公司望而却步,确为AI创业的小公司留足了利好。
不过,“道德风险”本身是存在变数的。
时代在发展,当下的“不道德”,并不代表未来的“不道德”。
1983年,有3个人因为跳舞被定性为“流氓罪”而判处死刑,但今天别说3个人跳舞,就是30个人“打扑克”也没人管。
不管当下如何抵制,科技发展都将如脱缰野马,奔涌向前。
拥抱AI,这是迟早的事情。
文章来自 “ AI-TNT ” 原创,转载请注明出处
【开源免费】paperai是一个可以快速通过关键词搜索到真实文献并将其应用到论文写作当用的功能。
项目地址:https://github.com/14790897/paper-ai
在线使用:www.paperai.life
【开源免费】ScrapeGraphAI是一个爬虫Python库,它利用大型语言模型和直接图逻辑来增强爬虫能力,让原来复杂繁琐的规则定义被AI取代,让爬虫可以更智能地理解和解析网页内容,减少了对复杂规则的依赖。
项目地址:https://github.com/ScrapeGraphAI/Scrapegraph-ai
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales