ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
“一人AI公司”已实现年入百万
8994点击    2024-11-20 15:26

门外汉也能搞点钱的AI时代


大模型在国内发展两年多,现在已经进入“各类应用涌现”的时代。最近跑了一些AI的场子,见识到一些很新的AI应用,有的应用把我这个文科生都看兴奋了。


一些有想法的人已经先行一步,开始用这些AI应用赚生活费,有的还借力AI开成了“一人超级公司”,年赚近百万。这让我这个文科生也看到了希望,毕竟字节招聘AI大模型算法工程师,月薪已经40K、15薪起跳,文科生虽不会搞算法,但也有自己的优势。


本文试着讨论三个问题:


1、 大模型已经变得靠谱了?


2、 “AI一人公司”已经开始批量出现?


3、 我们的出路可以不是IT人才,而是AI人才?


#01 大模型已经变得靠谱了?


前不久,歌手尚雯婕现身B站的科学晚大会,可惜这次她没来唱歌,而是用一款名为Suno.AI的软件,现场即兴创作了两首歌。


一说到即兴,人们潜意识里都是观望着“是否会出糗”。此前有公众人物就在现场演示时翻车过。


只见尚雯婕在这款软件中,输入了歌词关键字、曲风、男声女声等关键词,也输入了自己现场哼的一小部分节拍,不到分分钟,一首歌就创作完毕。


令我这个“音痴”惊讶的是,歌词真不赖,没有错词错句,有的句子还填得比较有意境,不是小学生作文水平。


曲子谱得也不错,AI唱得也不差。听完这两首歌,自己跃跃欲试的冲动特别强烈,感觉自己以后是不是也能成为一个“AI创作歌手”


图|尚雯婕和助手用Suno.AI软件即兴创作歌曲


当然我并不太知道,这种现场是否是“真实的现场”,还只是一种提前训练好的“AI表演现场”。


AI软件变得“不犯傻”,有点儿刷新我的认知。在前不久上海召开的百度世界大会上,李彦宏说:过去24个月,大模型的最大变化是基本消除幻觉


所谓的幻觉,是指大模型“脑子不灵光”的一面,突出表现在文生图、文生视频时,出现的各种事实错误。


在这届大会上,有两款 AI应用,确实也令我这个文科生眼前一亮。


一个叫iRAG,中文名叫:检索增强的文生图技术,卖点是可以消除以前文生图时“生出”错误图片。


比如天坛祈年殿,众人周知有三重屋檐,但此前大模型在学习过程中,或因为数据量不足、或数据质量问题,会出现生成四重屋檐的情况,这叫做“事实性幻觉”。而iRAG称,能够解决这一问题,尤其对特定人物、特定物品能“精准生成”。


图|左图的祈年殿有四层屋顶,乍一看很难看出错误


不过,宣传是这样,我自己在已经导入了iRAG技术的文小言APP里试了下,比如输入“演员王x博在天津海河跳桥”,画面还大差不差,但试着输入“87版红楼梦演员贾宝玉开着特斯拉Model Y”时,画面就不太对劲,调了几版也不对,可能还是自己提示词输入有问题。


图|用iRAG技术做的两张图


所以我顿悟了“基本消除幻觉”的“基本”两字,而不是“完全”。


还有一项AI技术“秒哒”,也令人印象深刻,它主打的是:一款不需要写代码就能实现任意想法的软件。只需要使用者输入自然语言,就能开发各种应用。


李彦宏在现场演示的是:想制作一份电子邀请函,可以在秒哒里输入自然语言,让它来安排各种智能体(也就是人类的AI分身),来帮忙分别完成邀请函文案的创作,版式的设计制作,以及分发反馈。


它的“功德”给我的感觉是:现在很多专业码农都在用“文心快码”这种快速辅助编码产品了,但对文科生的我来说仍有高门槛。现在有了“秒哒”,感觉不会写代码的我,也能开发程序。


不过,这个应用明年一季度才上市,实际情况如何待检验。


大模型基本告别幻觉,这样的宣传被认为是为接下来涌现的各种“大模型应用”来铺路。毕竟AI不智能、反而智障,那就没法用。只有变得真正智能,用的人才会越来越多,才能形成大模型经济圈、甚至相关应用产业圈。


#02 AI一人公司已经开始批量出现?


OPEN AI的创始人萨姆·奥尔特曼有这样一句判断:“一个人就能做出市值10亿美金公司的时代马上就要到来。”这背后是借助AI之力。


看到这样的“大饼”,普通人本能就会敬而远之,因为预感不会发生在自己身上。但确实也就是这一年来,我们身边出现了很多利用AI应用来赚钱的“创业叙事”。


从9岁小学生利用大模型写书,赚了2万(参见《第一批AI原住民开始变现:9岁小学生,用大模型写书赚2万》),到创业小白用快手可灵等帮企业和政府做AI宣传视频,年赚30万(参见《第一批不找工作的年轻人,靠AI半年赚30万》)。他们虽然赚的钱跟10亿美金比起来不值一提,但正因为“普通”,故事反而更具感染力。


如今在各类AI新应用渐渐涌现的情况下,一批新的赚钱方式也出来了。


今年来,字节、腾讯、百度陆续发布了“智能体”这一AI应用。高深的词汇背后,大众可以把它理解成自己的AI分身,也有人形象把它称之为自己培养的一名“电子牛马”。


智能体适用于有一技之长的人——比如教师、心理咨询、律师、医生等,第一波人已经率先创建了自己的智能体。创建方式也特别简单,只需要在相关搜索框里输入“智能体”三个字,就能一键创建。


图|基本上是傻瓜式创建页面


驱动这群人积极性的一个重要原因是,智能体能给自己带来收入,也就是已经有了初步的智能体商业模式


有一位来自安徽的情感咨询师妈妈,就在百度搜索里创建了属于自己的“情感咨询师智能体”,提供在线情感咨询。如果你有情感问题,通过搜索,可能不那么难就能搜到她。


图|苏轼智能体聊天界面,他的回答答案全部来自他的文献资料


这位妈妈以前面对前来咨询的各路客户,很多问题都要不断重复,但现在有了分身,可以24小时在线帮忙“自主代答”,真人可以干点别的事。如果客户需要更一对一的真人服务,也可以通过智能体实现在线跳转,并完成付费。


这位妈妈说,玩了一个月“智能体”,给自己增收了3000元。


还有一位律师说,自己创建了法律类智能体,为用户提供在线的法律咨询服务。基础的问题用智能体来代答,难一点的法律问题、需要真人来1v1的,可以在线跳转,选择付费服务。律师说,玩了一个月,多赚了几万元。


可以看到,所谓“智能体” 的商业模式核心,就是一种加强版的“知识变现”。智能体在这里面扮演的角色,就是你的工作助理,帮你解决前置的、重复的问题,遇到有付费潜力的,再帮你转化。


当然智能体能否真正被更多人用起来、互动起来,还需要市场推广,建立大众心智,目前才刚刚起步。


如果不想这么复杂,一些AI创业者很常采用的一个“一人变现方式”,就是“AI咨询”。


《新周刊》就曾报道一位从大厂离职的管理岗员工,在裸辞一年里,借助AI同时开展了三项业务,成为“超级个体”,年入近百万。


这三项业务分别是:用AI来进行创作的自媒体业务、AI讲师、B端咨询。其中赚钱主力还是在B端咨询这一块。


这三者业务逻辑是,通过AI自媒体引流,向大众及各路企业输出自己在AI领域的认知与积累,进而开始尝试“AI知识付费”,然后吸引很多公司前来请教咨询,并请这位员工能用AI帮忙优化公司业务流程,提升经营效率。


这位员工说,目前工资并未达到以前的管理岗水平,但跟以前每日长时间的坐班相比,现在的工作更具有性价比——工作时间短了,赚钱效率高了


当然也应该清醒看到,AI应用并不能承受赚到钱的所有光环。做咨询,很重要的一个因素是人脉资源,这一点也不可或缺。


还有一位初中毕业的男生,不搞知识变现,他是创建了一家AI制作公司,专门通过生产和销售文生图作品,去抢传统画室的生意。


有一位从事油画生意的客户,以前是从传统画手那里购入画作,每幅画一般需要花费20元,而这位男生能通过AI在3小时内创作千幅油画,每幅画只卖8.8元,成功抢单。


这个模式已经不算新了,但这位初中毕业的男生能在市场搞起小水花,,还是在于他用AI应用触动了经济链条上最重要的两个元素。


一是价格成本,二是更高效率。


就跟拼多多用9.9崛起一样,任何商业机会就怕AI也来一出价格战。


如今,市场上尚没有计算出开了多少家这样的一人AI公司,但有一点可以确定的是:这种业态已经真实存在了。


#03 我们的出路可以不是IT人才,而是AI人才?


不管是不用写代码就能编程的秒哒,还是尚雯婕用的Suno.AI,这给我们这群AI门外汉释放的信息是:AI应用的门槛越来越普惠了,我们通过各种应用,通过自然语言交互,就能创作出各种文字、图片、视频以及广告创意。


这几天,有帖子截图显示,字节正在高薪招各种AI算法工程师,起薪40K、15薪。而被认为适合文科生做的AI数据标注,大概月薪10—15K。其实一些公司会找到宁夏县城这样的留守妇女,去做简单的数据标注,月薪也能达到4、5000元,大有平替文科生之势。


比较起来,感觉不怎么会AI的社科领域从业者,似乎越来越没有立足之地。


但就我目前跑的一些AI场子来看,感觉也不用这么悲观。因为各类涌现的AI应用,确实也在给我们提供结构性的创作机会。


关键是我们是否有“驾驭AI之脑”,也就是你是否拥有活用这些AI应用的能力,以及创意和相关的审美。


比如当你想做一张图时,文科生的优势被认为是能写出更好的提示词,去做创作。创作出后,文科生也能有更敏锐的审美,看AI是否做得好不好。


在海外,现在流行一种说法,“如果错过做IT人才,那就做AI人才吧”。这句话或也可套用在AI门外汉上。


最后,我们可以从大时代,来看现在我们面临的结构性机会。


李彦宏最近有个论断是,中国的大模型基建已经有了一定基础,“现在是应用来了的时代”。


意思是:过去两年,各平台疯狂卷大模型,相关基建已经有一定的成熟度,今年及以后将要开卷应用。


因为建而不用,大模型将沦为鸡肋,产生不了任何使用价值。同时从商业角度而言,AI投资也到了需要建立商业收益模型的时候,不能无限制只投入、不产出


先抛开前述的这些C端应用,B端企业感受到的大模型应用利点,可能更加浓烈和实际一些。目前,大模型行业在B端企业的应用,以智能客服、数字人交互等领域居多。


比如智能客服。早期的客服是关键词触发模式,看到客户提问中提到某关键词,它能蹦出提前准备好的答案,相对比较机械,有时回答也不智能。


但在大模型时代,伴随大模型在整体语义理解、分析、总结能力的提升,一些智能客服产品,比如百度智能云客悦、中国电信星辰语义大模型、网易等智能客服等,已经具备较高的服务能力。有某知名餐饮公司最近现身说法称,在使用了百度智能云客悦来做获客和售后,问答准确率能达90%,同时还节省了50%以上的人力成本。


还有数字人领域,以前企业创建数字人,对话交互也比较机械,服务能力不高,开发成本还很贵,但现在像曦灵数字人平台4.0等这样的平台,打造的3D数字人成本价在此前的上万元上做了大幅下降,而且依靠语言大模型,互动起来更加智能,不但有专业性还有情绪。


图|数字人的打造成本这两年骤降,人们只需要用手机对着自己的脸,就能操纵数字人的脸


这些企业级应用给企业带来了实实在在的利点,同样大模型的应用逻辑如果套用在普通人身上,也可以得出以下这个结论:


大模型亦或者AI,并不是要来取代你,而是为了拓展你的能力,让你成为一个“一体五面”型的多面手。


它延展的是我们的机会,而不是缩小我们活跃的空间。这或许是AI人才与IT人才之间的区别。


文章来自于“真故研究室”,作者“龚正”。


关键词: AI , iRAG , 秒哒 , AI挣钱
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

5
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales