藏在小红书里的AI神器,或是小红书40亿美元收入后的第二增长曲线

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
藏在小红书里的AI神器,或是小红书40亿美元收入后的第二增长曲线
5279点击    2024-11-24 11:31

藏在小红书里的AI神器,或是小红书40亿美元收入后的第二增长曲线


Z Highlights


  • 截至目前,小红书已在大模型、AI 对话、AI 搜索、AI 绘图等 4 个领域进行了布局。陆续上线了 6 款产品,主要围绕搜索和创作这 2 个领域。但是处于对生态破坏以及 AI 落地的的不确定性,小红书并没有大肆宣扬自己的 AI 产品。


  • 达芬奇的逻辑,是通过 RAG 技术对自家的数据信息进行搜索、总结生成。长内容的回答,推荐相关笔记。而 AI 声聊则是通过选择不同的音色和旋律,把你想说的话唱出来。


  • 小红书的思路是先看用户需要什么、新的场景能不能跑通,再去调用手里的资源。对于去年刚刚实现盈利的小红书来说,商业化能力还需要再进一步被证明,在尚未验证落地场景前,入局大模型这场花费高昂的游戏有着极高的风险。


01 小红书已悄悄入局大模型之争


众所周知,AI 回答靠不靠谱,除了模型自身的智力外,在很大程度上还依赖于内容语料。而对于国内互联网来说,有 4 个地方内容质量最高:百度百科上的常识内容,小红书上的干货、总结内容;微信公众号的长文内容;以及 bilibili 的长视频内容。


由于目前的 AI 还不能直接看视频,所以 B 站还未被 AI 给攻下。剩下的 3 个内容源,一直是大模型争夺语料的内容高地。哪家 AI 掌握了这些内容源,哪家的回答质量就能够更上一层楼。文心有百科加持,元宝有公众号独家,而小红书谁来接入?


其实,在去年互联网大厂 AI 大模型之战风起云涌,小红书也早已悄悄加入战局。截至目前,小红书已在大模型、AI 对话、AI 搜索、AI 绘图等 4 个领域进行了布局。陆续上线了 6 款产品(其中 1 个已下线),主要围绕搜索和创作这 2 个领域。但是处于对生态破坏以及 AI 落地的的不确定性,小红书并没有大肆宣扬自己的 AI 产品。


藏在小红书里的AI神器,或是小红书40亿美元收入后的第二增长曲线


02 达芬奇:不会画画,但私信可以得到“达”案


文艺复兴时期最完美的代表”达·芬奇思想深邃、热爱探索世界,对知识有着广泛的兴趣。而小红书的这位达芬奇依靠小红书的强大语料和知识库来回答,同样知识广泛,语言俏皮。可以理解为小红书版的 ChatGPT。


然而,想要找到他并不容易,需要搜索”达芬奇”点击关注方可使用,这代表着使用者必须听过“达芬奇”的这款小红书 AI 工具的名字方可使用。因此,这款产品的声量并不大,真正触及到的用户较少。


藏在小红书里的AI神器,或是小红书40亿美元收入后的第二增长曲线


它的逻辑,跟腾讯元宝、知乎的知海图 AI、抖音的 AI 搜差不多,都是通过 RAG 技术对自家的数据信息进行搜索、总结生成。长内容的回答,推荐相关笔记。


从实际使用来看,达芬奇有一定实用价值,特别是攻略类的回答,独一份的事无巨细。小红书的笔记从购物/旅游/美食/学习/考试/求职攻略等,到使用体验、硬核干货、软件教程、读书笔记、职场心得,甚至到求医问药,应有尽有,所以达芬奇对于攻略类的问题也算是手到擒来。


就“北京一日游”这样的旅游攻略类问题,达芬奇的回答对比其他 AI 助手,具体又贴地气。


藏在小红书里的AI神器,或是小红书40亿美元收入后的第二增长曲线


但也存在一些问题。例如在提问“推荐轻松的 citywalk 路线”时,达芬奇也还不能识别提问者的 IP 地址,以此作为回答前提。只能将几个城市的 citywalk 路线一并列出。


藏在小红书里的AI神器,或是小红书40亿美元收入后的第二增长曲线


很多时候达芬奇的回答模棱两可,例如提问达芬奇完美日记的产品有什么缺点,达芬奇的回答就比较潦草、空泛,不仅没有举例而且并没有针对性的点出产品真正的缺点,而是用套话绕圈子。相比之下 kimi 可以明确的·点出问题所在。


藏在小红书里的AI神器,或是小红书40亿美元收入后的第二增长曲线


总体来说,达芬奇的最大优势就在于它的经验是具体的,这在众多 AI 助手中是独一份的,但回答匹配度不太稳定且不够精准,还需要不断调试。


03 AI 声聊,适合年轻人发疯体质


AI 声聊的入口就藏在小红书群聊底部输入框的+号里


藏在小红书里的AI神器,或是小红书40亿美元收入后的第二增长曲线


在这里你可以变声,把你想说的话唱出来,并且有多种音色和旋律可选。


从《咒术回战》的五条悟到《原神》的雷电将军,再到《甄嬛传》的华妃,应有尽有,不过都并非 CV 本人的声音。除此之外还有东北老哥、宝岛甜妹、佛系淡人、奶萌正太音……


藏在小红书里的AI神器,或是小红书40亿美元收入后的第二增长曲线


只要选择想玩的模式,输入想说的话,选择音色,AI 就会自动将文字转为语音发送。使用同一个声音超过一定时长,还会掉落一张专属的异世界身份牌。


藏在小红书里的AI神器,或是小红书40亿美元收入后的第二增长曲线


在这里,你可以当 AI 唱作人,用小甜歌的方式打开周董的《一路向北》,把《夏天的风》这首充满清新夏日风情的歌,改成活力动感的 K-pop 风;也可以在群里不定时发疯,用风云校草的音色说《米奇妙妙屋》中的经典开场白;也可以和群友玩 cosplay,用不同的语音风格和朋友沟通。


藏在小红书里的AI神器,或是小红书40亿美元收入后的第二增长曲线


据大模型初创公司 Minimax 发文透露,AI 声聊用的就是 Minimax 的语音模型,涉及到的技术包括:音乐合成、语音合成和音色克隆。


总的来说,这个功能通过提供变声和唱歌的方式,用户之间的互动更加多样化和有趣。更便于小圈子之间的互相交流,让更多 i 人也可以快速的融入圈子。这也算是小红书对于 AI 的一次成功探索。


然而根据体验,这应该不会是一个高频使用场景,如何让用户持续停留依然会小红书需要面对是一个问题。


04 AI 还不是小红书的重点


若是以外界的视角旁边小红书布局 AI 的一年,会得出“声量未起、一波三折”的结论。对话助手“DAVINCI 达芬奇”、AI 群聊助手等应用,小红书并没有进行大量的宣传并将它们放在最显眼的位置,在用户中也没有太大的声量。


但对应用属性突出的小红书而言,AI 大模型的价值在于支持自身应用,但在应用场景还不明晰的当下,AI 大模型的价值在内部尚未得到验证。可以说,当下 AI 还没有成为小红书的布局重点。


据知情者透露,小红书的思路是先看用户需要什么、新的场景能不能跑通,再去调用手里的资源。而目前小红书产品侧的业务重心仍在短视频,这也占据了大部分的人力和金钱资源,留给 AI 探索的资源并不多。对于去年刚刚实现盈利的小红书来说,商业化能力还需要再进一步被证明,在尚未验证落地场景前,入局大模型这场花费高昂的游戏有着极高的风险。


当然,小红书也必须要对技术变革做出快速响应。他们的解法是在自研模型的同时,以股东的身份,战略投资了 MiniMax 和月之暗面两家大模型独角兽,同时基于 MiniMax“abab”等第三方大模型做产品。比如这次提到的两款产品。


05 张德兵,小红书大模型领队人


去年 3 月,小红书筹备了独立的大模型团队,核心员工来自广告业务的 NLP 技术团队。主要负责人为张德兵,薯名为“宇尘”,毕业于浙江大学丘成桐数学英才班。在负责小红书的大模型之前,张德兵曾担任过一年的小红书智能多媒体算法负责人,主要负责 AI 和音视频算法方向。在更早期,他还在快手担任多模态智能创作组负责人,负责视觉相关的算法研发。


2023 年 10 月,在小红书 REDtech 青年技术沙龙上的分享中,张德兵第一次较为公开地提及了小红书大模型的两个落地方向:多模态技术,以及 AI 内容创作工具。


在他看来,文本、视觉、语音、音乐,任何两种模态的迁移和转换是当下重要的研究方向,比如:电商场景下的智能客服、搜索场景下对用户笔记更精确的理解、在智能创作场景下对用户素材的智能配乐/文案生成/跨模态的转换和生成创作等等。


“小红书承载了不同模态的内容,这些模态如果可以让创作模态大幅度下降,让用户记录和表达自己的生活的时候,能够根底成本、更加快捷,这是一个很有意思的方向。”张德兵说。


作者:Zhengkai Fu


来源:


[1] 低调上线AI机器人达芬奇,吃喝玩乐小达人,小红书的未来就靠它了-36氪


[2] 实测小红书AI声聊,一种适合年轻人体质的发疯社交?|AI新榜_功能_Trik_模型


[3] 抖音、小红书又加一个抢用户新功能-36氪


[4] 巨头围攻大模型,小红书却不急不慢-36氪


[5] 小红书AI悄咪咪上线,它懵了,我也懵了 - 大模型知识库|大模型训练|开箱即用的企业大模型应用平台|智能体开发|53AI


文章来自于微信公众号 “Z Finance”,作者“ Z Finance”


藏在小红书里的AI神器,或是小红书40亿美元收入后的第二增长曲线

关键词: AI , 小红书AI , AI神器 , 人工智能
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

3
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI