二次元垂直大模型,快看AIGC业务初露峥嵘

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
二次元垂直大模型,快看AIGC业务初露峥嵘
6875点击    2024-09-02 11:16

如果能比肩Character.AI的对话能力,IP角色互动实现沉浸式聊天就不是空话。


此前在2022年年末,横空出世的ChatGPT成功普及了一个新名词“AI大模型”,一时间大量互联网厂商开始一拥而上,扎堆做大模型也成为了2023年互联网行业一道独特的风景线。除了阿里、百度、腾讯、字节跳动等巨头做通用大模型之外,中小厂商则往往会选择因地制宜,做针对特定行业或领域的垂直大模型。


二次元垂直大模型,快看AIGC业务初露峥嵘


比如说在去年春季,漫画平台快看宣布成立AIGC事业部。时隔一年,快看方面也向外界公布了其正在研发的AI产品。7月11日,在由全球领先数据库公司Zilliz举办的User Tech直播活动中,快看方面透露,目前在尝试基于开源大模型进行微调,训练快看在二次元领域的垂直大模型。


根据快看方面的说法,目前快看在AI智能问答和IP角色互动两个场景已取得实质性进展,相关AI产品也正在内测,用户未来将很快能够体验到新产品的功能。据悉,快看方面是借助大语言模型(LLM)和检索增强生成技术(RAG)来提高作品搜索转化率,并为搜索带来新的活力,他们采用“微调大模型+RAG增强”策略构建了内部PGC专题知识库、UGC帖子知识库和问答知识库。


二次元垂直大模型,快看AIGC业务初露峥嵘


简单来说,快看此次搭建的二次元领域垂直大模型主要应用在两个场景,其一是类似Character.AI力推的AI角色扮演,其二则是基于自家内容库搭建的一个应用于二次元领域的AI搜索。其中,AI智能问答能够帮助用户从海量的漫画作品中找到自己想要看到的,而IP角色互动这个场景则满足了用户希望自己喜爱的漫画角色能够打破第四面墙、与自己面对面交流。


乍一看,快看选择的方向算得上是因地制宜,毕竟成立于2014年的这家公司,做的就是定位国内年轻读者的国漫IP平台和分享社区,在经过十年的发展后已经成为了国漫行业的龙头,拥有超过1.3万部漫画作品和80%的头部优质IP。想要用AI赋能产品,从而在腾讯、B站等更加强势的竞争对手挤压下留住用户,这就是快看做AI产品的初心。


二次元垂直大模型,快看AIGC业务初露峥嵘


然而,AI赋能并非一蹴而就。先来说说“AI智能问答”的问题,基于庞大的内容库做AI搜索显然不是问题,比如知乎就做了“知乎直答”、微信读书做了“AI问书”,这些都是相关厂商对现有资产的充分利用,但快看的问题则是相较之下内容库有些单薄,毕竟1.3万部漫画作品其实并不算多。而AI大模型之所以能够实现智能涌现,大规模参数是关键,而1.3万部漫画即便是作为小尺寸模型的语料可能也很勉强。


如今国内市场的文生视频大模型为什么会是快手的可灵一马当先,而不是优酷背后的阿里、腾讯视频背后的腾讯,以及爱奇艺背后的百度,就是因为快手日均新增短视频的数量在千万级,总计已有超过百亿条短视频内容,而爱优腾等长视频网的内容库则是以万为单位。“漫画大模型”之所以到如今都没有问世,正是因为漫画作为一个新兴的媒介,它的历史底蕴不如书籍、创作门槛却堪比长视频。


二次元垂直大模型,快看AIGC业务初露峥嵘


尽管1.3万部漫画作品看起来很多,但是细分到不同类型,可能每个品类就只有几百部作品,实在是不太能发挥AI智能问答的作用。至于IP角色互动,确实是当下AI应用领域的热门场景AI伴侣,上至作为独角兽的Character.AI、下至OpenAI GPTs商店里泛滥的AI女友,AI伴侣的魅力就在于可为用户提供情绪价值。


由于现代人的生活节奏加快、工作压力增大,导致许多人缺乏时间和精力去建立深入的人际关系,在同真实的人类交友困难重重的情况下,百依百顺的AI伴侣就不存在什么问题了。就像AI伴侣满足了男男女女交友的需求,快看的IP角色互动则满足了漫画迷看到自己喜欢的角色鲜活起来的需求。其实从某种意义上来说,由AI加持的IP角色互动就与Cosplay有异曲同工之妙,都是通过满足人们的情感需求来创造商业价值。


二次元垂直大模型,快看AIGC业务初露峥嵘


相比于AI伴侣,快看目前在做的IP角色互动还有一个巨大的优势,那就是角色与用户的情感连接并不是凭空捏造的。如今Character.AI为什么处境艰难,关键原因就是聊天机器人缺乏连贯的叙事,用户更难以从特定场景开始培养感情,而是直接切入对话。反观快看的IP角色互动则有漫画作品来做支撑,人物的塑造、世界观的描绘都不需要AI来介入。


如果快看能做到比肩Character.AI的对话能力,所谓IP角色互动实现沉浸式的聊天就不是一句空话。如若不行,快看建设二次元垂直大模型的想法或许就要竹篮打水一场空了。


文章来源“三易生活”,作者“三易菌”


二次元垂直大模型,快看AIGC业务初露峥嵘

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI漫画

【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。

项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file

在线使用:https://aicomicfactory.app/

2
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

3
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

4
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

5
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

6
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales