ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
又来3款,字节加速探索AI应用市场
8669点击    2024-05-15 10:37

根据我们不完全统计,字节跳动旗下目前已经有 11 款面向 C 端用户的独立产品,涉及 AI 创建平台、AI 聊天工具、教育、互动剧情、修图等 5 个类别。


除了在《半年连推 7 款产品,AI 时代字节也能大力出奇迹吗》和《字节 Gauth,海外碾压作业帮》两篇文章中提到的 8 款产品,今天又带来了 AI 生图产品 PicPic、AI 教育产品河马爱学、AI 剧情互动产品猫箱 3 款 App。



下文将借助具体的产品,分析字节跳动在做 AI 应用上的一些思路和策略。


01 PicPic:AI 写真+文生图,海外复制妙鸭相机之路?


PicPic 是字节跳动面向东南亚市场推出的定位“妙鸭+Dreamina”的 AI 生图产品。



不同于妙鸭相机需支付 9.9 元才能开始制作自己的数字分身,PicPic 目前包括建立数字分身、选择模板、文生图在内的生图功能均免费向用户开放。


根据点点数据,PicPic 自 2024 年 2 月 8 日上线以来累计获得了 11 万次下载,其中 75% 来自菲律宾,余下来自马来西亚。


从市场选择和变现策略来看,PicPic 似乎并不需要承担太多营收指标。而且从 Cici、BagelBell 等产品的上架和营销区域来看,字节似乎更倾向于先在东南亚市场进行产品测试,取得一定结果后再带到中国市场和其他市场。总体来看,尽管产品很多,但在实际投入上似乎更加倾向于保守路线。


另外,其实在过去的这些年明显能感觉到字节是“时光机效应”的受益者,不过不同于古早互联网时期将海外产品思路带回国内,字节运用自己独特的本地化优势和增长能力将已经在国内或者其他区域市场得到验证的产品带到全球,从目前上线的产品来看,似乎在 AI 时代仍打算继续延续该思路。




AI 分身


系统在扫描用户的正脸、左侧脸和右侧脸的照片之后即可直接生成 AI 分身,不过为了获得更好的效果,PicPic 鼓励用户上传 3-8 张正脸无遮挡照片,等待一小时左右可生成分身。


在分身的生成上,PicPic 比妙鸭相机更方便,在制作妙鸭相机分身时用户需要上传 14-50 张多角度、多表情、多光线的照片。


首先,值得肯定的是 PicPic 生成的数字分身与用户自身的相似度非常高,特征捕捉非常准确,而且不会过度美颜和美化。


但是或许是由于会捕捉到川字纹、法令纹等这些在脸上都不明显的动态纹,所以体验期间偶尔会有“一键换脸”的既视感。


而生成分身之后,用户主要有三个使用分身生成写真的方式:


1、直接使用系统预设的 AI 分身模版,目前 PicPic 提供古典艺术、虫晶蝶舞、城市漫步三个预设模板,数量相对较少。



从生成结果来看,每组照片会给出 4 种选择,用户可以从中选择自己感兴趣的一张,如若不满意也可重新生成,照片的风格与预设风格一致,而且成功概率也比较高。


但也存在生成结果并不稳定的情况,比如虫晶蝶舞的 2 图和 4 图出现了面部变形、脖子变形的情况;城市漫步四张图片中有三张图片没有手,有手的一张还出现了多手指、手指扭曲的情况。


相比之下,妙鸭相机的模板选择更为丰富、生成的结果也更为稳定,另外除了常规的模板风格,妙鸭相机还会针对节日和重大活动推出相应模板,比如情人节、妇女节、春日、冬日、圣诞等等,从这点来看,不仅增加用户的可选性,更是提升复购和留存的好方法。



妙鸭相机 


而从模板本身的完成度来看,个人觉得 PicPic 生成的结果还是更像 AI,但妙鸭相机生成的效果更像是艺术写真,尽管有较为明显的美颜和修图处理。



妙鸭相机 


2、通过对主体、环境、氛围和风格的关键词描述生成想要的分身写真,通常需要 4 分钟左右可以生成。



用户可以完全自定义关键词,也可以从系统预设的 AI 灵感标签中直接选择,PicPic 按照将所有关键词分成角色、发型、服装、配饰、动作、美颜、室内、室外、主题、元素、灯光、艺术风格、色调、效果等 14 个类别,不限标签数量。



从生成的结果来看,笔者自定义填写的 2 寸证件照、吊带郁金香、战国袍奔跑照、红色晚礼服,四次关键词预设效果均未达到预期,其中最为主要的问题出现在关键词理解错误。


当笔者将提示词换为英文后,得到的照片相关度会有所提高,但整体的稳定性还是会差一些。


另外,我们注意到或者是暂未攻克“手”的处理难题,在生成的结果中,PicPic 似乎在故意“隐藏手”,要么截掉手的部分、要么自动设定插兜、抱胸等动作,而在难以避免的露手图片中,手指数量错误、手指比例失衡、关节扭曲的情况时常发生。



在使用系统设定的关键词灵感生成标签来看,也同样会出现关键词理解错误、关键词缺失、手指错误等情况,其中生成的刺猬头图片重新定义“刺猬头”发型。



整体上,使用关键词描述生成的分身效果未达到直接可使用的程度,不过值得肯定的是,生成的结果中五官结构较为稳定。


3、直接使用灵感广场感兴趣的照片并使用已经预设好的关键词,一键生成。暂时无法确定灵感广场的关键词是来自用户还是官方,不过使用非常便捷,选择喜欢的照片直接点击使用生成分身即可得到同款。这也是现在很多 AI 生图社区的 Remix 功能的简版。



从结果来看,灵感广场的生成效果与 AI 分身模板接近,基本上可以达到看到的效果。





不过当留意细节时,就会发现身体比例失调、眼神乱瞟、手指错误等情况也时常发生。


不过不知道是关键词还是投喂素材的原因,感觉审美有点老旧,经常会觉得自己穿越回了 21 世纪初...


除了生成这一部分,用户还可以对已经生成的图片进行风格选择和扩图,风格改造速度非常快,而且完成度较好,扩图则永远在等待...





AI 图片风格化


用户可以为上传的照片选择模板或者设定关键词改变图片原有风格,目前 PicPic 提供传统漫画、3D 角色、赛博朋克、极简蓝白、水彩、经典漫画、黏土、涂鸦风、蒸汽朋克、像素风、温柔漫画、黑白铅笔、漫天泡泡、海底世界等 14 种种不同的风格。


为了测试不同风格的完成度和效果,我们选择了近期热播的电视剧《与凤行》的女主赵丽颖和男主林更新照片作为测试对象。





虽然风格对应准确,但似乎人物特征捕捉得并不好,几乎每一张照片都无法看出照片原本的样子,显然这在当前市场中竞争力并不强。


AI 生图


在 PicPic 里,用户还可以通过自定义关键词直接生成照片,PicPic 的优点是生成速度非常高、而且一个描述会生成多种不同风格供用户参考。





不过直接拿 PicPic 与妙鸭相机对比也算不上公平,妙鸭相机已经经过了一段时间的发展和调整,而PicPic 才上线 2 个月,还是要观察其后续发展。


另外,尽管我们前面已经提到 PicPic 可能暂时不需要“扛业绩”,而且当前用户基数也不大、强大的中台能力让消耗的成本也相对可控,不过从免费分身、东南亚市场变现方式来看,想要实现 ROI 转正可能并不容易,这一点是可能需要想在东南亚做 AI 数字写真的创业者结合自身业务和储备资金做相应的考量。


02 猫箱:AI 剧情互动,沉浸式陪伴表达


猫箱,也是字节跳动在海外测试成功后带回国内的又一案例,作为一家全球化公司,字节已经习惯性地将同一需求在国内和海外进行双向验证。 



根据点点数据,2024 年 3 月上线的猫箱(原名话炉)累计获得了来自 App Store 的 5 万次下载,其他应用商店的数据要稍多一些,各端均在 10 万次以上。 


相比之下,更早上线的猫箱海外版 BagelBell 已经获得了 120 万次下载,主要来自印尼、菲律宾、巴西和马来西亚。而在我们 2 月发布的文章中 BegelBell 的下载还不足 20 万次,也就是说其在过去的三个月获得了 100 万次新增。



在功能上,猫箱与 BegelBell 差异不大,具体可见《半年连推 7 款产品,AI 时代字节也能大力出奇迹吗?》中对 BegelBell 功能和体验的描述。  


另外,有趣的是虽然市场变化,但受欢迎的剧情仍然是恋爱、校园、霸总、狼人、年下,不过猫箱中出现了更多武侠、宫廷、神话、穿越智能体,这也和国内用户喜欢的题材相契合。 



另外,从笔者体验以及用户反馈来看,猫箱中 AI NPC 的“人设”要比 BagelBell 的更加稳定,甚至能扛过多次重复测试。以笔者测试的一位冷血魔尊为例,当对方表示自己中毒并在彻查原因时,笔者重复“你在干嘛”5 次,对方均给出的不同的回答和表现,而且生气怒度不断上涨。 


另外,相较于 BagelBell,猫箱中声音的设定变得更加符合 AI NPC 人设,体验感和沉浸感有所增加。 


AI 剧情互动领域的参与者越来越多,大厂、社交创业者、AI 创业者都在尝试入局,更有趣的是在这个过程中社交和游戏的边界正在逐渐模糊,甚至会有从业者表示“乙女游戏,要小心了”,不过从创业者对话和用户调研结果来看,多模态的互动方式以及更加稳定的人设可能才是高留存和高变现的关键。 


03 河马爱学:AI 时代,字节教育会不一样吗?


河马爱学是字节跳动 2024 年 1 月面向国内市场推出的AI教辅平台,综合了文生图、文生文等多项 AI 技术,提供作业批改、作文指导、解题思路以及剧情互动等多项服务。 



这也是目前字节跳动浮出水面的第二款 AI 教育产品,在白鲸出海前几天的《字节 Gauth,海外碾压作业帮》文章中提到 Gauth 在海外拿下了不少 MAU,凭借 AI+ 真人的双轮策略以及丰富的题库,Gauth 拿到了 AI 教育领域的入场券。 


而河马爱学,则仍在发育期,由于国内的产品下载分散在各个应用商店,我们无法统计准确的下载和活跃数据,但从各个应用商店显示的下载量来看,似乎仍在早期发育阶段。 


河马爱学官方将功能分成问答、学习工具和素养提升三大类别,具体到功能来看,实际上提供作业批改、口算批改、作文批改、语文作文、英语作文等 10 项功能。 


作业批改、口算批改、作文批改


用户直接拍照上传作业,系统会对作业进行自动扫描并判定对错,除了单纯的对错,河马爱学还会给出正确答案、错误原因、改题思路等,帮助用户改正错误。 


拍题解题的需求在国内已经经过作业帮和小猿答疑(原小猿搜题)的验证,字节也算借着 AI 东风加速向前。 



从笔者的测试体验来看,批改准确率较高,而且会根据用户的年级给出针对性的建议,但是对卷面的整洁度以及拍摄的清晰度有一定要求,卷面较乱或者分区混乱的情况下可能会出现误判。但卷面整洁其实是对学生尤其是低年级学生一个不低的要求。 






语文作文、英语作文


河马爱学会根据用户设置的命题给出作文建议,帮助用户更好理清题意、获得高分。 


其中英语作文会在用户填写完成题目后,结合用户当前所在年级给出推荐时态、写作要点和易错点,另外还会给出一些可能用到的单词、词组、句型和例句,帮助用户表达正确但是不会给出范文。 


语文作文则更加细致,用户除了要设置题目还需设置作文要求的文体和字数,系统会根据用户设置内容给出题目分析、立意角度、选材建议、提纲建议和范文。 


而且需要验证家长身份后才可查验,充分考虑到了孩子可能会直接照搬范文的情况。 


文学素养和互动故事


相较于以上两个更倾向帮助用户更好地完成作业,文学素养和互动故事更像是帮助用户进行思维发散和逻辑锻炼。 




在文学素养场景下,用户需要先选中想要进行深度了解的古诗,并会在接下来的剧情中扮演一个角色,通过多人、多地探访了解古诗背后的故事,而在了解古诗的过程中用户需要正确回答 AI NPC 提出的与古诗相关或诗人相关的问题才可进行下一步。当用户回答错误时,AI NPC 会鼓励用户再次思考和尝试,或者给出提示。 


河马爱学借用了游戏的闯关设定,用户只有在完成与上一个 AI NPC 的互动后才可能遇见下一个 AI NPC,来推动情节继续向前发展,可以在保持趣味的基础上,帮助用户在巩固古诗的基础上打开视野、养成探究的好习惯。 



在互动故事场景下,用户需要先选择古诗题材和故事背景,之后还需要在系统提供的品质中找到所扮演的主角具备的主要品质,并与 AI 一起续写故事完成故事的创作,河马爱学选择的很多是科技、悬疑、奇幻、魔法、冒险题材,可以帮助学生锻炼想象力。 




通常情况下,故事在进行至少 5 轮以上的对话后,才可生成结局,因此用户需要根据设定的目标推导尽可能合理的剧情来推动故事发展,而且根据用户所选特征不同,过程中会解锁不同的能力,另外还会伴随知识科普,在探索结束后用户可以更详细地了解相关知识。 


图片创作



用户可使用河马爱学进行语音生图、文字生图和头像制作功能,通过进行关键词的设定生成符合自己需要的图片。从体验来看,生成风景和动物的结果,要比生成人的结果表现更好,相较于目前行业生成效率来看,速度还是略慢了一些。 



河马爱学 AI 生成图片 


学习互动、趣味挑战


河马爱学将豆包、Cici 的对话互动模式引入平台,用户可以直接以对话的方式了解和学习,从体验来看应该是有进行针对性训练,在进行一些发散性问题思考时,会有意引导用户进行自主思考。 



另外,用户在与河马爱学 AI 盐盐互动时可以进行趣味挑战模式,参与“你画我猜”“21 问猜词”和“情景挑战”,用户需要在规定次数或者规定条件下给出正确答案或者完成任务即可获得胜利,比较适合学生进行短暂放松和调节。 


笔者将该应用安利给了身边三位二年级、六年级和初二学生的家长请他们帮忙测试,对方表示确实节省了一些基础问题的时间,但面对复杂题型表现不如预期,另外卡顿、加载过慢的情况也时有发生。另外,其中两位低年级学生家长表示,孩子很喜欢互动故事。 


尽管,关于教育的风向和政策在不断变化,但就实际情况来看,教育仍然是刚需中的刚需,这也是字节跳动为什么会在教育领域拼拼出手的原因,不知道 Gauth 和河马爱学等 AI 教育产品能否帮助字节跳动获得教育赛道的头部玩家入场券。 


整体来看,字节选择了“最火”的 3 条赛道继续推出和迭代新品,来尽可能提升实现 PMF 的成功率,而在不同赛道的产品里,AI 生成功能又有所交叉,来提升能力的有效复用。 


对于字节这样的大厂来说,虽然 AI 生成功能依然有些不稳定,但依然是唯快不破。 


本文来自微信公众号“白鲸出海”(ID:baijingapp),作者:白鲸小编


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI漫画

【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。

项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file

在线使用:https://aicomicfactory.app/

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0