现状+应用场景+工具盘点+10大趋势
“是时候开始为AI热身了!”
近年来,在经历了ChatGPT、Midjourney等国际AIGC产品的飞速发展,以及百度文心、阿里通义、Kimi等国内AIGC产品的激烈追赶后,2024年,几乎每位互联网用户都或多或少接触了AIGC技术产生的内容。从智能手机中的大模型助手,到日常所见的AI生成图片,再到职场中的AIGC工具辅助优化工作,AIGC内容已遍布人们的生活中。
尽管AIGC技术的应用仍存在一些争议,但其带来的极大便利已让人们难以拒绝。
在过去一年中,靠谱二次元密切关注了AIGC的发展趋势和业界态度,并陆续发布多篇关于AIGC产业分析的文章,涉及工具盘点、实际应用、产业变革等多方面(点击回顾)。
2024年5月,我们重新梳理了现阶段泛娱乐产业——包括动漫、游戏、影视产业相关的AIGC技术发展现状,并对常用工具做出了盘点,综合行业内的认知与展望,出品了这份《2024年AIGC发展趋势报告》,并通过本文进行详细解读,以其为业界后续在AIGC投入及应用方面提供新参考。
注:本文AIGC的讨论范围多集中于文娱产业,不进行过多技术相关的深入探讨;另因产业迭代迅速,本报告具有一定的时效性。
AIGC,即人工智能生成内容,是近年来在人工智能领域兴起的一项重要技术。它通过使用机器学习和深度学习等技术,使得计算机能够自动生成各种形式的数字内容,如文本、图像、音频和视频等。
AIGC的发展可以追溯到上世纪80年代,但真正取得突破性进展是在过去的十年里。随着深度学习技术的发展和大数据的积累,AIGC技术在自然语言处理、计算机视觉和语音识别等领域取得了进步。
随着互联网和移动互联网的普及,用户对多样化、个性化内容的需求日益增长,这为AIGC技术的应用提供了强大的驱动力。AIGC技术在内容创作、个性化推荐、智能客服等领域的应用,能够有效提高生产效率、降低成本,并提升用户体验。
在国内,百度、腾讯、阿里、科大讯飞、字节跳动等科技巨头在AIGC技术的研究和应用方面取得了许多重要成果,推动了国内AIGC技术的发展。
AIGC技术在2023-2024年飞速发展,对多个行业产生了颠覆性的影响。其中AIGC已经在广告、游戏、自媒体等内容创作领域实现了广泛应用,教育、电商、软件开发、金融等领域也尝试扩大AIGC的应用范围。
从商业视角来看,AIGC技术可以提高生产效率,降低成本。例如,在内容创作领域,AIGC技术可以帮助创作者更快地生成高质量的内容;AIGC技术可以提供个性化的服务,提高用户体验;AIGC技术可以帮助企业进行创新,帮助领导者开拓新的商业模式。
AIGC技术的前景非常广阔。随着技术的不断进步,AIGC技术有望在更多的领域得到应用,并进一步提高生产效率和用户体验。同时,AIGC技术的发展也面临一些挑战,如数据隐私、算法偏见等问题,需要进一步的研究和解决。总体而言,AIGC技术的发展将对社会产生革命性影响,并成为未来科技发展的重要方向之一。
目前,大部分智能手机已经内置了先进的AI大模型。这些模型结合本地计算能力和云端资源,极大地提升了手机助手的功能。例如,文心一言、Kiwi等传统对话型AIGC产品已广受市场认可,这些产品的普及加速了AIGC技术在消费者市场的应用。同时,社交媒体平台如微博、快手、哔哩哔哩等也开始采用评论机器人等技术,通过AIGC的拟人化特性,增强用户体验并提升互动的趣味性。
在商业领域,AIGC技术已被广泛应用于办公流程优化和AI素材库的建立,有效提升了工作效率和专业性。例如,AIGC产品不仅帮助企业优化客服、美术和宣传发行等工作流程,还显著降低了人力成本。这些进展证明了AIGC技术在帮助企业实现降本增效方面的巨大潜力。
AIGC在「影视」行业的应用
在短剧行业,部分内容生产者已开始尝试利用AIGC工具拓展海外市场。这包括使用AI换脸技术,将演员的面孔更换为目标市场观众熟悉的人种,以及利用AI配音和字幕转换为当地语言。然而,这些工具目前主要用于快速占领市场,往往不会优先考虑质量,因此这些技术将很快经历迭代更新。
在影视宣传领域,AIGC工具也开始被应用,主要用于生成部分美术物料,从而支持宣传设计师的创意工作。
至于内容制作本身,AIGC技术目前还未在真人影视制作流程中广泛应用。预计随着如Sora等AIGC产品的成熟和商用推广,未来将在这一领域看到更多的实际成果。
AIGC在「游戏」行业的应用
AIGC技术在独立游戏领域已广泛应用。自2023年起,部分大型游戏公司也开始逐步推进工业化的AIGC美术流程。尽管如此,这些公司在实际应用中仍保持了相当的克制。除了美术外,AIGC技术在声音和配音领域也已稳定使用,同时在市场推广和用户获取等方面,游戏行业同样展示了AIGC广泛应用的可能性。
虽然AIGC在游戏行业的发展速度非常快,但它也是目前游戏公司收到消费者投诉和争议最多的话题之一。
AIGC在「漫画」行业的应用
在漫画行业中,AI技术用于上色已非常成熟。许多流水线式的网文改编漫画项目已经开始采用AI上色技术,这项技术可以有效替代传统的手工上色过程,大幅提高生产效率。AI不仅能够快速匹配漫画的风格和色调,还能根据不同的情节和氛围自动调整颜色,以增强视觉效果和情感表达。
AI上色技术的使用还降低了制作成本,使漫画创作者能够将更多时间和精力投入到创作原创内容和质量需求较高的作品上。随着技术的进一步发展,预计AI将在漫画创作的其他环节,如分镜绘制、角色设计等前期工作中发挥更大的作用,进一步推动行业的创新和发展。
AIGC在「动画」行业的应用
在动画行业中,AIGC逐渐成为创新工具。部分动画制作公司已经开始利用AI技术来生成动画的部分场景,或是基于原画生成道具模型。这不仅优化了前期流程,还显著降低了制作团队间的沟通成本。例如,通过AI自动生成的场景可以帮助快速传达视觉效果的风格需求,从而加速决策过程并提升效率。
到了2024年,动画领域已见证了「全AI流程」制作的动画作品的问世。这类作品虽然在表现形式上更接近于动态漫画,但它们的出现标志着AI技术在动画制作中的潜力和前景。尽管这些早期作品在视觉呈现和剧本上还有极大的提升空间,但它们已经展示了AI在动画创作中的初步应用,是比较实验性的结果。
展望未来,我们期待如Sora这样的技术产品的迭代,他们有可能为AI动画引入更丰富的镜头语言和表达手法。这将使AI不仅仅是动画制作的辅助工具,而是能够完全参与到创作的各个环节中,从而开启AI动画的新篇章。随着这些技术的成熟和普及,我们可以预见到一个更加多样化和创新的动画垂类产业的兴起。
AIGC在「网文」行业的应用
在网文行业,AIGC的应用尽管面临一些技术和实践的挑战,但已经开始在辅助创作方面显示出其独特的价值。现阶段,完全由AIGC生成的网文还未能广泛实现,原因在于当前大型AI模型在长篇连续文本生成时会受到记忆持续性和深度理解方面的局限,这些问题限制了AI在理解复杂剧情和维持文本一致性方面的能力。
目前,AIGC技术已经在协助网络文学作者方面发挥了重要作用。AI可以帮助作者设计复杂的角色性格和背景故事,提供创意的剧情发展思路,以及生成与文本内容匹配的插图。这些工具不仅可以提升创作效率,还能激发作者的创新灵感,帮助他们突破创作瓶颈。
尽管AIGC在网文创作全自动化方面还有进步空间,它的辅助功能已经成为推动网络文学创新和发展的重要力量。未来,随着技术的进一步发展,我们可以期待AIGC在网文行业发挥更大的作用。
总的来看,受惠于OpenAI的可开发性和GPT4的易用程度,大量基于GPT4的AIGC工具诞生,国内在文心一言等大模型的API开放后也迎来了中文化AIGC产品潮。全球互联网迎来了移动互联网时代后的又一个产品爆发期,硬件厂商、云服务厂商、AI厂商也在爆发期中获得了新的机会,配合民用产品的百花齐放,得到了社会和资本的关注和垂青。
随着头部AI厂商不断推出可商业化使用的产品,大量开源技术也随之公布于众,学术界、商界就开源和闭源的AI发展发表出了不同的看法。就目前来看,开源和闭源AI产品都在为AIGC的普及做出积极的贡献,并未出现垄断的态势。
但与此同时,关于AIGC产品的伦理和版权风险在不断扩大,利用AI作恶的成本因为产品滥用而降低,这也是各家厂商需要迫切解决的风险点。
下面我们将从文字、图像、音频、视频、办公五个方向切入,例举现阶段AIGC常用的工具,并选择一款进行详细介绍。
「文字工具」
工具名:ChatGPT
开发商:OpenAI
应用场景:目前大部分网民的AIGC入门产品,现阶段最实用的文字类AIGC工具。用户只要简单的了解,就可以通过对话完成知识检索、文本概括、创意获取等流程。
发展现状:GPT4已相对成熟,对中文兼容性比较好,可开发性高。
「图像工具」
工具名:Midjourney
开发商:Midjourney
应用场景:场景创作、海报创作、人设创作
发展现状:开源图片AIGC工具Stable Diffusion在开发性上更强,但Midjourney的易用性更高,对于二次优化需求不强的美术环节更实用。
「音频工具」
工具名:Suno
开发商:Suno
应用场景:为低成本剧集、广播剧、独立游戏等制作配乐,包括纯音乐和AI人声歌曲。
发展现状:能够满足对音乐品质要求不高的听众需求,但目前中文人声清晰度还不够,加工再创造的难度更高。
「视频工具」
工具名:Dreamina
开发商:字节跳动
应用场景:基于图片或文字描述,生成3秒以上的视频。可用于部分图片的动态化,以及补足部分拍摄镜头的缺陷。
发展现状:目前国内可使用的文生视频/图生视频中生成效果比较好的产品,但和Sora仍存在差距,生成时长较短,视频稳定性不足,很难直接应用。
「办公工具」
工具名:WPS AI
开发商:金山软件
应用场景:协助使用者完成文字、排版上的优化。
发展现状:综合功能完备,但仍与专业做文档调整、PPT优化的部分细分工具存在差距。
趋势一:AIGC,推动文娱产业转型升级
随着AI技术在文字、声音、图像和视频等多个领域的发展,其相关产品的普及程度持续提升。用户对这些大型AI模型的运用越来越熟练,将AIGC应用到文娱领域已经不再是一个新奇的概念。尽管在文娱产业全流程中引入AIGC还不现实,但越来越多的工具正在优化至可用。AI的应用使得企业在低端需求上降低了对专业人员的依赖,同时也降低了行业的入门门槛。
这种趋势预示着文娱内容生产的工业化过程将会迎来一系列创新的AIGC产品。这些产品不仅能够降低成本、提升效率,而且标志着行业对未来技术的积极拥抱。随着技术的进步,我们可以预见到AIGC将在创作、编辑、分发乃至营销等多个环节中发挥重要作用,极大地推动文娱产业的转型和升级。
总的来说,文娱行业,尤其是比较新的ACG相关领域,其工业化正处于一个由点到面的转型期,AIGC技术的融入无疑将为这一行业带来前所未有的创新机会和发展潜力。
趋势二:开源与闭源产品互补,形成良性循环
随着AIGC技术的快速发展,开源与闭源产品之间的相互作用日益显著。由于训练一个大型AI模型需要巨大的成本投入,许多公司选择将其大模型闭源,以便专注于提升自身产品的性能和特色。然而,尽管这种趋势明显,如Meta、Google等公司仍然坚持推动开源技术的发展,这大大促进了AIGC技术的普及和创新,为中小规模的团队提供了接触和使用AIGC工具的机会。
在未来,随着AIGC技术门槛的逐渐降低,越来越多的个人开发者和初创团队将利用开源技术开发出创新且实用的AIGC应用。这些产品往往会在遵守开源协议的前提下维持开放状态。同时,闭源产品也从开源社区获得灵感,不断开发出商业性更强的功能。这些商业功能也有可能被开源社区借鉴,从而丰富了开源工具的功能性和易用性。
这种互补的关系创建了一个良性循环,不仅推动了技术的快速发展,也帮助商用AIGC产品逐步成熟。在这个过程中,开源和闭源产品的互动不断提升彼此的价值,共同促进了整个AIGC领域的创新和扩展。
趋势三:使用门槛再降低,覆盖领域更多元
在2022至2023年,虽然像ChatGPT和Midjourney这样的AIGC工具已能以自然语言进行交互,但大多数其他AIGC工具的使用便利性仍待提升。从2023年下半年开始,AIGC产品通过应用程序(APP)和硬件集成等方式取得了显著进步,使得绝大多数常用AIGC工具在使用上变得更加友好。
此外,市场上出现了大量“一键包”和“云机房”产品,极大地简化了用户的使用门槛。这些产品允许用户无需复杂的环境搭建,也不用受限于本地计算能力,即可轻松地开始使用相关工具。这种变化不仅提高了AIGC技术的可达性,也极大地扩展了其应用范围。
展望未来,随着AIGC技术栈的持续成熟和稳定化,我们可以预见到基于当前技术栈的AIGC产品将进一步拓展到更多领域。这些产品不仅会覆盖更广泛的应用场景,还将提供更加便捷的操作体验,使得各行各业的操作者都能轻松掌握并利用这些强大的工具。这种趋势不仅推动了AIGC技术的普及,也为各行各业带来了前所未有的创新机会。
趋势四:AIGC培训步入红海
随着2023年AI技术的热潮,许多IT和美术相关的培训机构开始察觉到机遇。到了2024年,为了吸引新学员,这些培训机构纷纷采取策略,邀请国内外著名的AIGC领域KOL担任客座讲师,并寻求大公司的背书以及职业认证,以增加其课程的吸引力和权威性。
然而,初期的培训机构并未能达到预期的培训效果,加之AIGC工具的快速迭代更新,这些因素导致不少潜在学员持观望态度。
在这种背景下,AIGC培训市场正在迎来竞争激烈的发展阶段。传统培训机构、KOL们都意识到,将AIGC培训作为一种盈利手段具有巨大的潜力。因此,这个领域正逐渐变成一个竞争红海,众多参与者都在努力占据一席之地,希望通过提供高质量的教育内容和服务来吸引并培养更多专业人才。这种趋势不仅显示了市场对AIGC技能的急切需求,也预示着培训领域将快速发展和变革。
趋势五:体面运用AIGC,成企业选用工具的重点
在企业探索AIGC的过程中,许多通过AIGC生成的成品难以达到应用标准。然而,用户与AIGC的持续磨合逐步帮助双方找到了彼此的舒适区,优化了工具的应用方式和成效。
目前,虽然许多从业者已开始在日常工作中利用AIGC工具,但这些技术往往没有被广泛共享或加入到公司的核心业务流程中。从2024年开始,随着更多办公协同产品融合AI大模型和AI工作流程,这种局面开始改变。AIGC的引入不再是将员工与AI对立起来,而是成为提高工作效率和创造力的有力工具。
同时,随着公众对AIGC作品接受度的提高,企业和内容生产者越来越倾向于主动利用AIGC工具来提升产能和创新能力。这种趋势表明如何“体面”地运用AIGC工具,在保持产品品质和道德标准的前提下有效利用这些技术,已成为未来企业选用AIGC的重点。
趋势六:国产AIGC工具价格战打响
自从AIGC产品面世以来,许多产品开始采用会员付费和按次付费等商业化模式进行尝试,尽管这些策略在短期内尚未彻底解决产品的盈利问题。然而,随着AIGC技术的不断进步和普及,各大AI厂商和互联网公司陆续推出了能够广泛应用的大模型,激烈的市场竞争已不可避免。
在这种背景下,用户对AIGC工具的价格敏感度提高,特别是那些对工具性能要求不太高的用户,他们更倾向于基于价格来选择产品。因此,随着市场上同类型工具的增多,价格竞争已成为AIGC商用工具争夺用户的重要战场。
面对即将到来的价格战,AIGC工具提供商需要找到合适的策略来平衡成本和收益,同时,通过不断升级和优化产品功能来形成竞争壁垒。如何在保持价格竞争力的同时提供独特的价值和优异的性能,将是AIGC工具厂商在未来市场上制胜的关键。这不仅需要技术创新,也需要对市场动态和用户需求有深入的理解和快速的响应。
趋势七:定制化AIGC工具普及,AIGC服务更精准
随着开源大模型和开源技术的增多,越来越多的厂商已经开始组建自己的AIGC团队。虽然开源模型提供了一个良好的起点,但这些通用模型往往需要进行深度定制才能满足企业内部更为细致的需求。因此,在2024年,我们或将看到更多互联网和内容团队不仅在训练和优化现有模型上下功夫,而且也会努力开发更适合自己特定需求的AI大模型。
这些团队将采用更加策略性的方式,通过选择和组合现有的AIGC产品,开发出更加精细化的工具。这种方法不仅提高了工具的适用性,还增强了企业在其专业领域内的竞争力。例如,专注于生产内容的公司可能会开发一个特别擅长生成特定类型媒体内容的AI模型,而电商平台则可能开发一个优化产品描述和客户交互的模型。
随着AI技术的不断进步和边际成本的逐渐降低,这些定制化的大模型和工具变得更加易于实现,更多企业能够参与到这一领域中来。长远来看,这种趋势不仅会促使各个领域内的AIGC应用更加专业化和多样化,也会推动整个行业的创新和发展。
趋势八:高端AIGC人才出现缺口
尽管AIGC相关的培训课程和视频教程已经相对普及,但市场上仍然缺乏能够深度并有效地将AIGC技术应用到实际内容创作中的专业人才。这种状况部分原因在于技术的快速迭代,使得即使是已经接受过培训的AIGC专家也需要不断学习,更新其知识储备以跟上技术的发展,否则很容易变得过时。这种快速的技术更迭,导致了AIGC应用在某些领域被视为“玩具”,未能被充分利用于更加专业的环境。
随着2024年更高质量、操作成本更低的AIGC产品陆续推出,市场对于能够熟练运用这些高端工具的人才需求将急剧上升。这些人才不仅需要掌握技术的应用,更要能够创造性地利用这些工具来优化内容创作、提升生产效率,乃至推动新产品的开发。在这样的背景下,具备高级AIGC技能的专家将成为各大企业争抢的宝贵资源。
因此,培养具备这些先进技能的人才不仅是教育机构的重要任务,也是企业内部培训的关键部分。预计企业和教育机构将会加大在AIGC领域的投资,通过提供更加深入和实用的培训,以满足日益增长的专业人才需求。这不仅会帮助缓解目前的人才缺口,也将推动整个AIGC领域向更成熟、更广泛的应用前进。
趋势九:企业AIGC平均成本下降,但总投入提升
随着AI技术市场的竞争加剧,AIGC产品和相关AI算力的价格已经出现了明显的下降。这一趋势为企业和个人提供了更加经济的选择,使得初步接触和试用这些技术变得更为可行。然而,尽管单个产品的使用价格下降,对某些闭源产品的依赖以及对AI技术日益增长的需求可能导致企业和个人在综合上面临更高的成本。
这种“单品降价,整体涨价”的趋势表明,虽然单一工具变得更加便宜,但随着企业将AI集成到越来越多的业务流程中,对这些工具的总体需求和依赖性增加,进而可能增加整体的技术支出。此外,闭源产品可能因内容授权或独家技术而收取更高费用,增加了企业对特定功能的投入成本。
尽管面临这样的成本压力,许多企业还是会选择在更多领域投入使用AIGC产品,以期通过技术的助力来节省时间和人力成本。这种成本效益分析的结果,或许会推动企业在决策时更加倾向于利用AIGC工具。随着AIGC技术的深入应用,企业的运营效率和创新能力可能会显著提升,从而加速其业务发展,提升市场竞争力。
因此,未来AIGC产品的成本和收益将成为企业策略规划中的关键因素。通过精明的投资和有效的资源配置,企业可以在保持成本效率的同时,最大化地利用AIGC带来的优势。这不仅涉及对当前成本的管理,还包括对未来潜在收益的预测和策略布局。
趋势十:AIGC产业迭代迅速,产品押宝困难
尽管当前AIGC产品已形成一些相对固定的模式,但在实际应用和用户体验方面,不同产品之间的表现仍有显著差异。AIGC领域内的热门方向,如长文本分析、长视频处理、智能体交互、以及人声音乐创作等,都吸引了大量企业的关注和投资。然而,AIGC领域的技术和市场方向每隔几个月就经历一次快速迭代,技术和模型之间的差异也在不断扩大。
对于AIGC企业来说,准确识别并投资于最适合自身长期发展的技术赛道变得尤为关键。选择正确的方向不仅可以最大化资源的效用,还可以确保企业在激烈的市场竞争中保持领先。
对于那些利用AIGC产品来提升产能的用户而言,频繁更换工具所带来的成本是一个重要考量。在这个变化迅速的行业中,选择那些迭代次数少、升级成本低的AIGC工具成为他们的关键策略。这种选择不仅可以减少因技术升级导致的潜在中断,也能确保在技术快速发展的环境中,企业能够持续稳定地提升效率和产出。
因此,无论是AIGC企业还是用户,都需要对行业趋势保持高度的警觉和适应能力,以便在不断变化的AIGC领域中做出明智的决策,并最大化技术投资的回报。
文章来自微信公众号“靠谱二次元”(ID:kpACGN),作者:靠谱ACG编辑部,36氪经授权发布
【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。
项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file
在线使用:https://aicomicfactory.app/
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】Deep-Live-Cam是一个只需一张图片即可实现实时换脸和一键视频深度伪造的AI项目。
项目地址:https://github.com/hacksider/Deep-Live-Cam
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】kimi-free-api是一个提供长文本大模型逆向API的开渔免费技术。它支持高速流式输出、智能体对话、联网搜索、长文档解读、图像OCR、多轮对话,零配置部署,多路token支持,自动清理会话痕迹等原大模型支持的相关功能。
项目地址:https://github.com/LLM-Red-Team/kimi-free-api?tab=readme-ov-file